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刖 m 

本书由三大部分组 成：对 《概率论基础》（第三版）正文的点 
评、对它的习题的解答与评注、三十篇与基础概率论教学内容紧密 
相关的教学札记。 

正文的点评，包括章前引言、课文导读和章后小议，对课文的 
重点与难点、结构和内容等作出评述。一般写得相当简练，让读者 
在学习的各个阶段都能反复参照，着眼于点化， 不妙 冷饭，不加罗 
列，目的在于帮助学生更上一层楼。 

作者深知，习题解答的公开有利有弊。经慎重考虑采用如下方 
式 处理： 对占总数三成的基本训练题只作切要的提示再给出简单 
答案，对其余的则给出详细的解答，并对几乎所有题目都写了评注。 
这样任课教师能根据课程要求对学生安排基本训练，学生也能根据 
自己的能力与爱好作出进一步的选择。评注则用来指明命题的含 
义，解题的要点或技巧，与课文的关联以及题目之间的联系。 

三十篇教学札记涉及概率的理论、应用与历史，是笔者四十多 
年教学的积累，这次借机形成文字，以教师为主要对象作交流探讨， 
也为学生提供课外阅读资料，希望有助于他们对本学科的理解与 
深入。 

教学札记的题材基本上有三类：第一类以“ XXX 和概 率论” 
为标题，介绍概率论的兄弟学科，这些学科用概率语言作为表达本 
学科基本概念的工具，初看它们是概率论的应用，事实上是这些学 
科提高了概率论在现代科学中的地位。这里只涉及最重要的几个， 
计有遗传学、统计物理学、量子力学、投资学、数理金融学、统计 
学。第二类，对在概率论发展史中始终有较大影响的几个历史问题 
作些梳理，包括分赌注问题、赌徒输光问题、圣彼得堡悖论、贝叶 
斯公式、正态刻画、切比雪夫不等式、博雷尔正规数等，利用这个 
机会还编写了 “概率论发展历史年表”作为全书附录。第三类，与 
课文内容关系密切，包括少量预备知识与若干外延，都围绕一个个 



专题写出。这些教学札记，每篇可独立阅读，整体编号，分列于最相 
关的章之后，暗示只要读完该章甚至前几节就可阅读。这部分材料 
对使用其他教材的师生有同等价值。 

总之，本书虽以概率论基础学习指导书的形式出现，但编写时 
一直关注使内容对一般学习概率统计的学生，教概率统计的教师以 
及关心概率统计理论与应用的学者都有参考价值。深知该书一定 
存在不少缺点与错误，作者诚恳地希望得到批评与帮助。 

这是我与陈子毅副教授的第二次合作。子毅是我的学生，后又 
成为同事。本书的编写分工 如下： 正文点评和教学札记由我 编写； 
习题部分由子毅全部再做一遍，写出初稿，半年间我们共同反复修 
改不下五遍，并由我写下评注。电子版本的所有文字工作全由子 
毅承担。我们的合作十分愉快而有成效。对于子毅的工作，我的感 
觉是“放 心”； 对于与子毅的合作，我的检讨是“本应从 80 年代开 
始”。 

对关心和帮助本书出版的朋友们表示感谢！ 

李贤平 
2011 . 2 . 7 . 
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《概率论基础》面向数学各专业和统计专业的学生，只假定学 
生具有微积分基础知识，因此也可供理工科、经济、管理甚至医农 
等学科中对概率论有较髙要求的系科作为教材或教学参考书使用. 
每周4学时,可在一学期内讲完主体部分.该书内容采用模块式结 
构，从而可以适应各种不同教学需要.各章节的逻辑关系如下： 



因此《概率论基础》可在三种水平下使用，主要区别在对极 
限定理的不同要求上. 

第一种水平称为基础教程.极限定理讲到伯努利试验场合，即 
经典的伯努利大数定律与棣莫弗-拉普拉斯中心极限定理，这两个 
定理可用较初等的方法证明. 





















第二种水平称为基本教程.极限定理讲到独立同分布场合，以 
特征函数为研究工具.国内外的同类教科书大体就讲到这种水平， 
已能满足数理统计等学科对概率论的要求. 

第三种水平称为髙级教程.大数定律部分详细介绍以概率1 
收敛性和科尔莫戈罗夫强大数定律，中心极限定理则讲到林德伯 
格-费勒定理. 

总的说，我国教材和教学大纲受苏联影响，在概率论的极限定 
理部分讲得比欧美同类教材既广且深. 

一般情况下，讲授基本教程就够了，但这主要应由任课教师根 
据具体情况自主决定. 



第一章事件与概率 


I 童丽 i 1 

本章讲述了概率的严格定义. 

机会游戏的对称性的利用和相对频率稳定性的观察在概率概 
念的建立中起重大作用. 

机会游戏提供了研究不确定性的典型例子，正是针对这种简 
单场合，终于在17世纪中叶结晶出概率的概念，从而宣布了概率 
论这一数学学科的诞生.由于一批著名数学家的参与，概率论的许 
多重要结果被建立，也有了广泛的应用，但是概率等基本概念的严 
格定义却经历了几乎整整三百年. 

当代概率的定义是一种数学定义，用公理化方式给出，并未指 
明它的具体意涵.本章结合概率概念的发展历史介绍这个过程，详 
细讨论了古典概型、几何概率等具体模型，导出许多基础性结果， 
也为理解（数学）概率的实际涵义提供坚实的背景. 

概率是对（随机）事件而言的，因此事件与概率是本章的两个 
主角，但是叙述还得从概率论的研究对象开始. 


课文导读 


§1.1 随机现象与统计规律性 

本节作为导引，介绍了概率论这一学科的研究对象与特色，评 







说了它的历史与前景，围绕频率与概率的关系渐入主题，为全书提 
供一个鸟瞰. 

随机现象是广泛存在的，因为有统计规律性即频率稳定性这 
一实践经验的存在，使之值得研究也可以研究. 

通过掷硬币、英文字母出现频率、高尔顿板等3个可以重复 
实验的权威性例子，证明了频率稳定性是客观事实而非主观臆断. 
师生们还可以进一步补充自己熟悉的例子. 

频率与概率是概率论的永恒主题. 

首先，概率的频率解释还是当今最通行的解释，在数理统计中 
频率学派仍占统治地位. 

其次，描述频率趋近于概率的大数定律总会是概率论的第一 
大定律. 

第三，在实际的工作中，用频率来作为概率的估值是十分自 
然的. 

《概率论基础》中提供的英文字母频率统计表是从大量出版 
物中统计岀来的，读者可试着任选一篇长度超过千个字符的英语 
文章作统计,一般就能得出大致相似的结果.因此利用字母出现频 
率就能破译早期那种用字母替换法编出的密码，这可以设计成相 
当有趣的一个实验性游戏. 

《概率论基础》第三版改以机票超售问题作为案例贯穿全书， 
本节提出问题，第二章设定概率模型，最后，在第五章给出解答. 
关于概率论的历史,参看本书最后的附录. 

概率论的重要应用在《概率论基础》的后续章节陆续展开， 
本书的教学札记中作了重要的补充. 

§1.2 样本空间与事件 

本节在集合论的基础上定义事件及其运算，是以后一切讨论的 
基础，务必牢固掌握. 

事件与集合，事件运算与集合运算的相似性，这个事实也是长 
期研究后发现的，目前已通行直接从这一事实出发，定义事件及其 



运算 • 


《概率论基础》认为对随机现象的研究联系到可以在相同条 
件下重复进行的“试验”，而试验的可能出现的结果称为“样本点”， 
样本点全体构成“样本空间” a “事件”则定义为样本点的某个集 
合，称某事件发生当且仅当它所包含的某一个样本点出现. 

在这个定义下，事件的关系及其运算可以与集合的关系及其 
运算建立如下对照表. 


符号 

概率论 

. 集合论 

Q 

样本空间，必然事件 

全集 

0 

不可能事件 

空集 

U) 

样本点（基本事件） 

元素 

A 

事件 

子集 

A 

A 的对立事# (逆事件） 

A 的佘集 

ACB 

事件 A 发生必有事件 B 发生 

A 是 B 的子集 

A = B 

事件 A 与事件 S 等侨 

>4与 B 相等 

AUB 

事件 >4与 B 至少有一个发生 

>1与 B 的并集 

ADB 

事件 A 与 B 同时发生 

.4 与 B 的交集 

A-B 

事件4发生而事件 S 不发生 

欠与 B 之差 

AB = 0 

事件 A 与事件 B 互不相容 

乂与 S 没肴公共元素 


样本空间的概念来源于统计学，它由统计学家冯 • 米泽斯 (von 
Mises , 1883-1953) 引入，欧美教科书普遍采用.我国的教材因受 
苏联教材影响，过去较多称之为基本事件空间.这个名称的缺点在 
于按《概率论基础》第一章§5给出的事件定义，基本事件可以不 
是事件，从而陷入窘境.因此还是用样本空间为宜，也便于与数理 
统计 对接. 

很快就会明白，概率问题的复杂程度与所需使用的数学工具主 
要取决于样本空间的大小，假如研究局限于离散样本空间，则所用 
数学工具相当简单，出了这个范围，难度立刻大增.为帮助没有系 
统学习过集合论的读者，特撰写教学札记之一 “浅谈集合的大小”， 
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扼要介绍有关集合大小的某些结果. 

经验表明，文图对理解事件的关系与运算帮助极大，阅读和解 
题时都要充分利用它 - 

初学时要训练对某一事件能用集合论符号表出，如《概率论 
基础》第一章§ 2例7所示，接着要熟悉对某一集合论表达式能用 
概率论语言解释，最后会感到二者实是一体. 

关于事件的无限运算,本节只引进可列并与可列交，而不像某 
些教科书在这里就讲事件序列的极限，以免吓退学生.出于教学法 
的考虑，为分散难点，《概率论基础》直至第五章§4才系统讨论 
事件序列极限. 

集合运算相对于算术运算实在更为方便，一是它成立对偶原 
理，另一是它成立第二个分配律. 

对偶原理是今后用得最多的恒等式，在概率论中它把诸事件 
至少发生一个与它们全不发生这两个十分有用的事件联系在一起. 

两事件等价，如4 == S ， 定义为4 C S 及 S C 4同时成立. 
在论证中，为了证明某两个事件等价，基本途径还是要逐一验证这 
两个关系，即从定义出发，舍此之外别无良策.学生们应踏踏实实 
做一两道这种题目，以增加感性认识，对偶原理及分配律都是很好 
的练习题.当然随着学习的深人，会推导出许多恒等式，这些在今 
后学习中便可直接弓 I 用而不必再加以证明. 

研究集合及其运算的另一方法（数值化）是引入示性函数，这 
联系到以后要讲到的随机变量及数学期望等概念.为使主线清晰, 
本书未予强调，但在第三章引入定义，习题四1题中汇总. 

§1.3 古典概型 

具有有限与等可能性两大特征的古典概型是概率论的诞生地, 
也是早期概率论研究的主要模型.这时的概率是一个比例,有相当 
直观的解释. 

仔细思考,会觉得人类要提炼出概率这么深奥的概念，也只能 



在这种最简单、最典型的场合.它是各种机会游戏，包括抛硬币、掷 
骰子、押宝、玩牌等等的模型化. 

本节用近代的观点介绍了这个模型，引导读者进入概率论. 

古典概型的结果和研究方法被广泛吸收到自然科学（特别是 
物理科学）里，表明现在仍未失去对古典概念和古典方法的兴趣. 
关于在统计物理中的应用可参看教学札记之十五“统计物理学和 
概率论”，在遗传学中的应用参看教学札记之七“遗传学和概率论' 

古典概率是一个比例，是两个正整数之比，为计算这个比例， 
必须发展相应的计数方法.事实上，西方排列组合理论的发展与概 
率论的发展紧密相关.教学札记之二“排列组合辑要”为读者提供 
一个关于排列组合的 纲要： 其中4张表格对排列组合作各种 分类; 
例子则显示排列组合的基本应用方式，大部分与课文 相关； 长期与 
学生的接触中被问得最多的是关于重复组合公式，故于该文利用 
不同题型给出4种不同证明. 

用等可能性来定义概率（事件发生的可能性)，逻辑上有些问 
题，但在古典概型场合人们会觉得很自然，主要是因为所考察的问 
题有一种对称性.在解题中充分利用对称性，可使某些问题化繁为 
简，例如本节例 3. 教学札记之三“对称性与概率计算”提供更多 
例证. 

摸球模型是很简单的一个模型，也是很反映随机现象本质的 
一个模型，因此在本书中反复被用来引进重要概念，例如在本节引 
入了二项分布与超几何分布.放回与不放回两种规则为何导致很不 
相同的结果，这是每一个学习概率论的人必须搞清的，其中的奥秘 
将随着本书的展开而逐步揭示.教学札记之十三“摸球与抽样”提 
供某些参考资料. 

古典概率计算大体分为直接法与公式法.直接法只利用古典 
概率的定义，以排列组合为工具计算有利场合数与样本点总数之 
比，大体在本节已讲清.公式法要用到概率的种种性质和推论，将 
在以后不断补充. 



鱼数估计提示一类主要统计问题和一种重要统计方法，最早 
由拉普拉斯对人口统计提出. 

古典概率三个基本性质为以后一般概率概念的定义作重要 
准备 • 

§1.4 几何概率 

几何概率继续拉普拉斯的路线——以等可能性定义概率.在 
这种场合获得一定的成功，也遇到新的困难. 

几何概率处理无限的场合，概率还是一个比例，不过改成几何 
体的测度之比，是两个正实数之比，既是定义也是计算公式. 

几何概率问题类型有限，典型例子不多,但蒲丰投针问题与蒙 
特卡罗积分计算有近代意义. 

这些例子中隐含的假定将在第三章§2中挑明. 

本节承前启后.几何概率的成功与失败都对近代概率的定义 
有明显的促进. 

本节首次出现事件的无限运算与概率的可列可加性. 


§1.5 概率空间 

水到渠成，本节引入概率论的公理化结构——概率空间 （ P , 
多， P ). 

主要的难点和要点在概率的定义域即事件域，的选择.太小， 
则事件太少，不能满足 需要; 太大， 则难以定义概率.最后的折中选 
择是包含一切关心的事件的 a 域，后者保证了事件对交、并、逆、 
差作可列次运算的封闭性，又把0及 O 包含在内. 

在这种 a 域上，能定义满足非负、规范和可列可加性的概率 
测度. 

于是科尔莫戈罗夫把近代概率论奠基于测度论之上. 

在离散样本空间中，多可以取为的一切子集，而且只要把 
总和为1的概率分配给每个样本点就能完成整个概率空间的构造， 
因此根本不用测度论.这种场合构成了概率论的初等部分. 



但是在样本空间为 R 1 , R 2 , R / 1 等常用场合，博雷尔 a 域在严 
格定义概率论的各种概念中是不可缺少的.《概率论基础》的方 
针是： 在满足概率论基本概念能严格定义的条件下,尽量少用测度 
论.本节是贯彻这个方针的起点. 

概率论的公理化定义使概率的定义与概率的计算脱钩,不像古 
典概型或几何概率那样.概率的定义甚至与概率的解释脱离，因此 
是一种数学概率论，它容许对概率涵义的多种解释，例如古典，几 
何，频率甚至主观的信念解释. 

在以后的讨论中，假定三位一体的概率空间⑼多，尸）已经 
给定 • 

从概率的三个公理能推导出概率的许多基本性质，如欧几里 
得几何一样，这些是我们已证得的定理，在今后讨论中可以方便地 
使用.导出的最复杂的性质是一般加法公式，能用它解决经典名题 
“匹配问题”.进一步的讨论见教学札记之四“一般加法公式及其推 
广” • 

可列可加性等价于有限可加性与某种连续性（上连续性，下连 
续性，甚至零上连续性)，从而保证了能进行极限运算.应当指出这 
些讨论中只用到单调类：即单调上升或单调下降的事件序列，因此 
正如本章§2中指出的，我们无须过早引入事件序列极限等较难的 
概念 • 


习题解答与评注 


1. 在某城市中，共发行三种报纸 A 在这城市的居民中, 
订阅 4 的占 45%, 订阅 S 的占 35%, 订阅 C 的占 30%, 同时订阅 
A 及 B 的占10%,同时订阅4及 C 7 的占8%,同时订阅 B 及 C 
的占 5%, 同时订阅 A , S , C 的占 3%, 试求下列百分率:⑴只订阅 
/的； （2) 只订阅 4 及 S 的； （3) 只订阅一种报 纸的； （4) 正 好订阅 
两种报 纸的； （5) 至少订阅一种报 纸的； （6) 不订阅任何报纸的. 


•9. 





提示： 用文图 ，细 分析 ，再 求和. 

答⑴30%; 

(2) 7%; 

(3) 73%; 

⑷ 14%; 

(5) 90%; 

( 6 ) 10 %. 

【评注】很有意思的一 道题. 不假定具 
有任何关于事件与概率的知识，却进行类似 
于事件与概率的计算. 

忒 S , C 把 D 分成不相交的8块，至少需给定7个百分比才 
能算出有关 答案. 

本题可与《概率论基础》§2例7 连读. 

2. 若 A ， B ， C 是随机事件，说明下列关系式的概率 意义: 
(1) ABC = A](2)AUBUC = A; (3) AB c C; (4) AcBC. 

提示： 搞清集合论含义，使用概率论语言（字面表达上不强求 
统一) • 

答⑴4发生，则 A C 必同时 发生； （2) S 发生或 C 发 
生时必有4 发生； （3) 為 J 5 同时发生必导致 C 的 发生； （4) 4发生 
时，5和 C 至少有一不发生. 

【评注】熟识一下集合运算符号并能用概率论术语表述. 

3. 在某班学生中任选一个同学，以事件 A 表示选到的是男 
同学，事件 S 表示选到的人不喜欢唱歌，事件 C 表示选到的人是 
运动员.⑴表述 ABT 及 ABC; (2) 什么条件下成立 ABC = A; 
(3) 何时成立 C C (4) 何时同时成立 A = B 及 A = (7. 

提示： 大胆用口语表述. 

答 （1) 选到的学生是男同学，又不爱唱歌，又不是运 

动 员}; 选到的是男同学，又爱唱歌，又是运动员 }; (2) 当所 

有男同学都不爱唱歌且都是运动员时成立；（ 3 )当不是运动员的学 





生必是不爱唱歌的学生时成立； （4) 男同学的全体就是不爱唱歌的 
学生全体,也是非运动员的学生全体时成立. 

[ 评注】具体事件的符号表达. 

4. 试证： 

n 

U 一 A\ + A\A2 + A2A3 + • • • + -A1A2-A3 * % A n , 

i=l 

并对 n = 4, 画出文图. 

证设 n = 2， 

-A1U-/I2 = i4i + (A2 — Ai ) =山 + A1A2 
假设 n = fc 时成立 

k 

LM j 4 i + A \ A 2 4 - -42-43 + • • ■ + i 4 iA 2> l 3 • • • ^ k — l-^k 

i=l 

则 

fc +1 k 

\J A i^= (U 

i=l »=1 

k lb 

=U a + (U 4)4+1 

i=.l 1=1 

k k 

=U A + ( Pi 

t=l i=l 

= A \ + A1A2 + A \ A 2 A ^ + ••• + 

k 

A1A2AS • • • Ak^iAk + A^U+i 

*=1 

所以我们已用数学归纳法证得 

n 

U =Ai + A1A2 + A1A2AS + • • • + 

i=l 

A \ A 2 A ^ - - - i 4 n - iA n 
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图 1-2 




n = 4 时的文图见图 1-2. 

【评注】把事件的并化为不相容事件之和的常见方式之一.本 
题亦可用事件等价的定义证明. 

若把烏看作第 i 次时进入某禁地，则上述表达式可称为‘‘首 
次进入分解”. 

5. 为“剪刀 • 石头 • 布”游戏造一个样本空间，定义有关事件， 
并考虑如何给定概率. 

答 样本空间(剪刀，剪刀)，（剪刀，石头)，（剪刀，布)， 
(石头，剪刀)，（石头，石头)，（石头，布)，（布，剪刀)，（布，石头)， 
(布，布) }• . 

以（次，巧）表示甲、乙两人玩这游戏时，甲岀手形乙出手 
形％，其中 A ， 巧， i，j = 1,2,3, 分别表示剪刀，石头，布三种 手形. 

可定义事件 { 甲贏 }={ (剪刀，布)， （ 布，石头)，（石头，剪刀)}， 
类似可定义事件{乙贏 }={ (剪刀，石头)，（石头，布)，（布，剪刀)}， 
定义事件{和局 }={ (剪刀，剪刀)，（石头,石头)，（布,布) }. 

可认为样本空间中9个样本点是等可能出现的，定义 P {{ A U 

■ Bj )} =吞， i，jf = 1，2,3. 

于是，甲贏 } = P { 乙赢 } = P { 和局 } = |. 

【评注】对一方而言，以等比例随机出剪刀，石头，布是最优策 
略.双方都采用最优策略则出现上述等可能情况. 

6. 若 A S ， C ， D 是四个事件，试用这四个事件表示下列各事 
件 ： （1) 这四个事件至少发生 一个; （2) 隼 S 都发生而 C，D 都不发 
生； （3) 这四个事件恰好发生 两个； （4) 这四个事件都不 发生； （5) 这 
四个事件中至多发生 一个. 

提示： 《概率论基础》 §2例7的 推广. 

答 (1) AUBUCUD ; 

{2) A BCD ; 

(3) ABCD + ABCD + ABCD + ABCD + ABCD + ABCD ; 
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(4) ABCD ^ AUBUCUJ 

( 5 ) ABCD + ABCD + ABCD^ABCD + ABCD . 

【评注】事件表示是学习概率论的入门功夫.这种表达式不唯 

一，一般喜欢 写成： ①简洁 形式； ②不相容事件 之和； ③乘积形式. 

*7 .从0, 1，2, • • • ，9中随机地取出5个数（可重复)， 以尽记 
某些数正好出现 i 次这一事件（例如52353,既 
属 于玢， 也属于设及五0)，试用文图表示五0， 

, • • • , Ee 的关系. 

解 Eq = £6 = 0 , C Ei, 

E1E5 = 0, E2E5 = 0 ， 

E3E5 — 0 , E4E5 = 0, 

E2E/A — 0, = 0, 

E \ E 2 E ^ = 0. 

【评注】全部做对有点难度. 

8. 证明下列 等式： 

⑴ G ) + 2 G ) + 3 G )— (:卜 1 

(2) ( l ) + 31 广 、(:) = ° 

⑶ 1:( 二) GH :::) 

证⑴等式 

1+ 0+0 2+ ...+ (:) xn =^ + x ) n 
两边对: r 求导，得 

⑺+ 2 0 21 +…+ O - 1 = …+工广 1 

令 : r = 1，即得所要证的等式. 

(2) 令上式中 x = _ l 即得. 
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(3) 展开等式 





g ⑩) cy )， 


\j=o v 
比较两边: r l 前的系数，就有 


a f( a + ^ 


=o 


自 0( 二 H a 


+ 6、 


(*) 


在 （*) 中取 Z = fl - r (0 彡 r 彡 a )， 则得 

I0U-M: 

记 a — r * 一 ） = fc ，则= a — r 一 fc ， 上式即为 


+ 6、 
— T 


gUJCH: 


+ &、 
— r 


也就是 


|:(二 )(:) = (: 


+ 6、 
- r 


【评注】用幂级数展开式证明组合恒等式是典型方法，请读者 
自行补充新例 . （*) 式即《概率论基础》的 （1.3.5), 是最重要的组 
合恒等式，有明显的组合含义. 

9. 一部五卷的文集，按任意次序放到书架上去,试求下列概率: 
(1) 第一卷出现在旁边； (2) 第一卷及第五卷出现在旁边; （3) 第一卷 
或第五卷出现在 旁边； （4) 第一卷及第五卷都不出现在 旁边； （5) 第 
三卷正好在正中. 
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提示： 作为.《概率论基础》 §3 例 1 的推广，用全排列直接计 
算. 学过前两章之后再回过头来，考虑其他解法. 

答⑴誉； (2)^； (3) ⑷差；（ 5 ) t 

【评注】古典概型常见类型之一：全 排列. 

10. 甲袋中有3只白球，7只红球，15只黑球，乙袋中有10只 
白球，6只红球，9只黑球，现从两袋中各取一球，求两球颜色相同 
的概率. 


提示： 两袋各取一球配对构成样本点. 


答 


207 

625 


0.331 2. 


【评注】简单古典概率 计算. 

11. 袋中有 n 只球，记有号码1，2,…， n ， 求下列事件的概率: 
(1) 任意取出2球，号码为1，2 •，⑺ 任意取出3球，没有号码1; 
(3) 任意取出5球，号码1，2, 3中至少出现1 个. 

提示： 不计顺序，宜用组合. 


答⑴ 


2 

n(n — 1) ’ 



⑶1一 



【评注】古典概型常见类型之二：不放回摸球 • 

12. 袋中装有1，2,…， AT 号的球各一只，采用⑴有 放回; 


(2) 不放回方式摸球，试求在第 fc 次摸球时首次摸到1号球的 
概率. 


提示： （1) 用重复 排列； （2) 用全排列或用对 称性. 

答⑴ L y 二; ( 2 )务 

【评注】重要的模型，有名的答案——开锁即为一例.两种不 


同摸球 方式， 导致很不相同答案. 

13.从6双不同的手套中任取4只，问其中恰有一双配对的概 
率是多少？ 
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提 示：从 12 只中任取 4 只构成样本空间，再细算有利场合. 

答 

^ 33* 

【评注】大约有近十种做法可得出这一正确 答案. 

14 .从 ri 双不同的鞋子中任取 2r (2r < n) 只，求下列事件发 
生的概率： （ 1) 没有成对的 鞋子； （ 2) 只有一对鞋子； （ 3) 恰有两对鞋 
子； （ 4) 有 r 对鞋子. 

解 （1) 有利场合是：先从 n 双不同的鞋子中取出 2 r 双，再 
从每双中任取1只，概率为 



(2) 有利场 合是： 先从 n 双中取出1双，其2只全都取出，再 
从余下的 n - 1 双中取出 2r - 2 双，在每双中只取 1 只，概率为 



⑶仿照 （2) 的思路，得概率 


(H 4 



(4) 有 r 对鞋子，概率为 
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【评注】上题的一 般化. 



15. m 个男孩和 n 个女孩 （n < m ) 随机地沿着圆桌坐下，试 
求任意两个女孩都不相邻的概率. 

解 m 个男孩排成一直线，有 m ! 种排列法.这 m 个男孩 
如排成一圆圈，则直线上 m 种排列法对应于圆圈上的一种排列 
法（例如以顺时针计)，所以 m 个男孩沿圆桌坐下的圆形排列共有 

— = (m - 1)! 沿圆桌坐的 m 个男孩间有 m 个空位来安插 n 

m 

个女孩，能使任意两个女孩都不相邻的坐法有种.样本点 

总数应为 m + n 个孩子沿圆桌坐下的所有可能圆形排列数.于是， 
所求概率为 

—-O CO 

(m + n — 1)! 广 m + n — 1、 

V n / 

【评注】以上解法用圆形排列得到答案，也可用圆形组合直接 
给出右端答案. 

16. (分赌注问题）甲、乙二人各出赌注 a , 约定谁先胜三局则 
赢得全部赌注，现已赌三局，甲二胜一负，这时因故终止赌博，若二 
人赌技相同，问应如何分配赌注，才算公平合理？ 

提示： 依再赌下去两人得胜的概率来分配赌注. 

答 3:1. 

【评注】本题是教学札记之八“分赌注问题”中提到的导致帕 
斯卡与费马通信并催生概率论的问题的简化形式，当时帕斯卡，费 
马和惠更斯都用木同思路与方法得到上述正确答案.希望你也能给 
出自己的答卷.下章将对这个问题作一般性讨论. 

17. 从52张扑克牌中任意取出13张，求： （1) 有5张黑桃，3 
张红心，3张方块，2张草花的 概率； （2) 牌型分布为 7-3-2-1 ( 最 
长花色有7张，最短花色有1张，其余二花色分别有3张及2张) 
的概率. 
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提示：⑴从 52 张牌中取13张构成样本空间，不考虑顺序. 
(2) 化为⑴ • 

答 ⑴ erno 

© ~~ . 

(2) P)(X)CT x4x3x2 , 

【评注】桥牌中牌型分布是一手牌强弱的主要因素之一，桥牌 
叫牌体系设计中牌型分布概率的计算至关重要.桥牌在所有竞技项 
目中是使用概率论最多的. 

18. 桥牌游戏中（四人各从52张纸牌中分得13张)，求4张 
A 集中在一个人手中的概率. 


提示： 参照上题. 



【评注】大牌是桥牌中一手牌强弱的另一个主要因素，其分配 
方式也提出大量概率计算问题. 

*19. 在扑克牌游戏中（从52张牌中任取5张)，求下列事件 
的概率 ：⑴以 A 打头的同花顺次五 张牌； （2) 其他同花顺次五张 
牌； （3) 有四张牌同 点数； （4) 三张同点数且另两张也同 点数； （5) 五 
张 同花； （6) 异花顺次五 张牌； CO 三张同点数，另外两张不同 点数; 
⑻五张中有 两对； （9) 五张中有 一对； （10) 其他情况. 

提示 ： 52张牌中取5张不计序，样本点总数为( 5 5 2 ) . 重点在 

计算有利场合数.注意两点游戏 约定： ①样本点若已归入前面的事 
件（强的)，则不再归入后面的事件（弱 的). ②约定 A 可放在 K ， Q , 
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J 之前，也可放在4, 3, 2 之后构成顺次. 
答所求概率 如下： 

为 ( T ) = 2 598 960. 

分子分别为： 


英文名称 分子 概率 



【评注】取材于一种在西方流传很广的随机游戏.答案中的概 
率数值依次上升，表明相应各组牌的强度依序下降. 

以上三题虽以纸牌游戏形式给出，实是古典概型的一种典型 
题，属于超几何分布及其推广. 

【劝告】以下几题是读者考验自己进行事件分析和古典概率 
计算能力的好题目，务必经过自己反复思考再看答案，以免糟蹋 
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题目. 

20. 从装有号码1,2,…， iV 的球的箱子中有放回地摸了 n 次 
球，依次记下其号码，试求这些号码按严格上升次序排列的概率. 
提示：要害在“严格上升”. 



【评注】看了答案就平淡无奇. 

21. 在上题中这些号码按上升（不一定严格）次序排列的概率. 
答如果这些号码不一定是严格上升的次序，意味着 n 个号 

码可以重复，这就相当于从#个不同元素中取 n 个元素的重复组 

合，由此得本题所求的概率为 ‘ P ^ M . 

N n \ n J 

【评注】重复组合数的推导见教学札记之二“排列组合辑要”. 

22. 任意从数列1，2, …，# 中不放回地取出 n 个数并按大小 
排歹! J 成 ： A < x 2 < ■• - < x m < ••• < x n , 试求 x m = M 的概率，这 
里 1 < M 彡见 

提示： 考虑 x TTi = M 之下有几个小于 Af ， 几个大于 Af . 

C - l \ /1\ (N - M \ 

- 1 八1八 n - 

【评注】预告多元超几何分布，见《概率论基础》（ 3 . 2 . 7 ). 

*23. 上题中，若采用有放回取数，这时 xi ^ X 2 ^ ^ x m 

彡 • . •彡 Zn ， 试求 Xm = M 的 概率. 

解从1，2,…， i \ T 中有放回地取 n 个数，这71个数可分为3 
类： 小于 M ， 等于 Af ， 大于 M . 以&记取到小于 Af 的数的次 
数，以心记取到大于 Af 的数的次数，则取到等于 M 的次数为 

n — A：i — 灸2- 

在固定 fci , h 的条件下，取到 fci 个小于 M 的数 ， n - fci - 灸2 
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个 M ， fc 2 个大于 Af 的数的概率为 

n ! ( M - l ) fcl ( iV - M 产 1 2 

- k 2 )\ N 71 

易见 fci 可取 0，1，2 ，."，m — 1， fc 2 可取0,1，2 , •••，n — m ， 于是所 
求概率为 

VT n ! ( A / - 1产 (AT 一 M )〜 

hh k ^ n -^~ k ^ Wn 

【评注】事件分析对复杂概率计算十分重要，本题是一个很好 
的 例子. 本题亦预告多项分布，见《概率论基础》 (3.2.6). 

24.从 (0,1) 中随机地取两个数，求下列概率：⑴两数之和小 
于 1.2; ⑵两数之积小于 0.25; (3) 以上两个要求同时满足. 

解从（0, 1) 中取岀两数分别记为 X ， y ， 则 ( x , y ) 与单位正方 
形 ABCD 内的点——对应. 



图 1-4 


(1) 直线: r + y = 1.2 与 SC 交点坐标为 （1，0.2)， 与 ZX 7 交点 
坐标为 （0.2,1)， 所以由几何概率可得 

P = (l - i x 0.8 x 0.8 )/l = 0.68 

(2) 双曲线: ry = 0.25 与 SC 交点坐标为 (1,0.25), 与 DC 交 
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点坐标为 (0.25,1), 所以由几何概率可得 

ri 0.25 

P = 0.25 x 1 十 - dx = 0.596 6 

J0.25 ^ 

(3) 直线 x + y = 1.2 与双曲线 ； ry = 0.25 的交点坐标为 
(0.932, 0.268) 和 (0.268,0.932), 所以由几何概率可得 


r0.268 

0.2 x 1+ (1.2 —x)dx 

Jo.2 

r ° 932 0.25 , f 1 ^ a 

+ - dx + (1.2 — x) cLr 

JO .268 ^ Jo.932 


P 


JO.268 工 

0.593 


【评注】几何概率典型题目 之一. 

25•从（0, 1) 中随机地取二数 b 及 c ， 试求方程 x 2 +6 x + c = 0 
有实根的概率. 

提 示：有实根的充要条件是判别式 A = b 2 — Aac ^ 0, 此处 
a = l ( 图 1-5), 

答. 

【评注】几何概率典型题目之二. 

26. 在一张打上方格的纸上投一枚直径为1的硬币，方格要多 
小才能使硬币与线不相交的概率小于1%. 

解设方格边长为 a ， 当硬币圆心落于图 1-6 中阴影部分才 

与边界不相交，由几何概率得不相交的概率为 P 

因为当 a < 1时，硬币必定与线相交，故只需考虑 a > 1，由 

a z 9 

【评注】取材于一种美国游戏. 

27. 某码头只能容纳一只船，现预知某日将独立来到两只船， 
且在24小时内各时刻来到的可能性都相等，如果它们需要停靠的 
时间分别为3小时及4小时，试求有一船要在江中等待的概率. 
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图 1 一 5 
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图 1 一 6 


提示： 仿会面问题（图 1-7). 


1 152 

【评注】会面问题推广之一 ■ 

28. 两人约定于7点到8点在某地会面，试求一人要等另一人 
半小时以上的 概率. 


提示：半小时内会不到面（图 1-8). 



【评注】会面问题推广之三. 



29. 在一线段中随机地取两个点把线段截为三段，求这三 
段可以构成一个三角形的概率（三线段能构成三角形的充要条件 
是任意二边之和大于第三边). 
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解设在线段中随机取两个点，从左到右依次记为 
和 X2 ， 令 AB = a , AX \ — xi , AX2 = X2 , 则有0彡 xi 彡 X2 彡 a . 
( x u x 2 ) 与三角形 EFG 内的点是——对应的（图 1-9). 

三线段构成三角形的充要条件是 

Xi + (X2 — Xi) > a - X 2, 

， Xi + (a — X2 ) > ( X2 - Xi ), 

( X2 — xi ) + (a — x 2 ) > xi 

这决定三角形区域 PQR 、 故所求概率为^ 

4 

【评注】又一类几何概率典型 问题. 

30. 在线段 [0,1] 上任意投三个点，问由0至三点的三线段能 
构成三角形与不能构成三角形这两个事件中哪一个事件的概率大. 

解设0到三点的三线段长分别为 a ;， 记相应的右端点 
的坐标为 a ：， 2；, 显然有0 < x ， y，z < 1. 这三条线段构成三角形 
的充要条件是 


x 十 y > z, y + z>x, z + x > y 

在线段 [0,1] 上任意投三点 a :， ％ z 与立方体0 < : r 彡1， 

中的点 (x ， y ， z) ——对应，可见所求“构成三 
角形”的概率问题可归结为在边长为1的立方体 r 中均匀地掷点， 
而点落在区域 


x 十 ？ />z, y + z > z + x > y 

中，即相当于落在四面体 

O-ABC D-ABC 
中（图 1-10), 易见相应的体积是 

V ( T ) = 1, V (0- ABC ) + V ( D - ABC ) = \ 

由此得，“能构成三角形”与“不能构成三角形”两个事件的概率一 
样大. 
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图 1-9 图 1-10 

【评注】几何概率的又一典型题. 

总的说，几何概率题型有限.本书正文与习题已显示其中大部 
分. 

*31. 从一只装有100只灯泡的箱子中任抽5只灯泡，发现有2 
只是次品，你对此枇灯泡的次品数作何估计？（这种抽查当然用不 
放回方式.比较用最大似然估计法所得结果与用频率估计概率法 
的结果是否相同 .） 

解设100只灯泡中有次品灯泡 n 只. 

频率估计概 率法： 


n 


最大似然估计法: 


可以算得当 


202 


2 

5 


x 100二40 


100 - n 
3 


)0 


Pn = 

(100、 


V 5 ) 

Pn 

n (98 _ n ) 

Pn - 1 

(101 _ n)(n — 

! 时， 

Pn _ i 

— i ， 71 < 


Pn- 


202 


时，则 Pn > Pn^l 
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n 〉丁时，则有 p n < p n . u 因为 n 取整数，所以当6 = 40时，有 
0 

P40 最大. 

因此据最大似然原理当100只灯泡中含40只次品时，任抽5 
只发现2只次品的可能性最大. 

本题中两类方法估计的结果是一致的. 

【评注】数理统计中参数估计的两种主要方法的预示. 


*32. 利用概率论的想法证明下列恒 等式： 

A 一 a (^4 一 ci )( i 4 — a — 1) (^A. — a ) * • • 2 • 1 A 

+ 乂_1 + (乂一 1)( 义一 2) +•••+ (3 —— l )...( a + l)a = a 

其中 A a 都是正整数，且>1〉 a . 

证设袋中有4只球，其中有 a 只是白球，其余为黑球.现不 
放回地从袋中逐个取球,则第 fc 次才首次取得白球的概率为 

cz cl{^A 一 ci) (^4 一 cl 一 1). * • (*A — d 一 fe + 2) 

Pi = 又 ， Pfc = ^ A(A-l){A-2)^^(A^k + l) ^ ， 

fc = 2, • • • y A 一 d +1 

因为袋中只有 a 只白球，其余为黑球，所以第1次或第2 
次 …… 或至多到第 A - a +1 次必取到白球，因此必有 


1 = Pi + P2 +- H 7M—a+1 


a 



a(A — a ) 
雄- 1) + 



a(A — a ) • • • 2 • 1 
A(A — 1 ) … （a + l)a 


等式两边同乘以 4 得 

a 


A — a (A — a )( i 4 一 a - 1) (^4 — a ) • • • 2 , 1 _ A 

•A — 1 (^4 — 1)(^4 一 2) («/4 — 1) • • • (a + l)ct a 


【评注】这种类型的问题甚多，证明思路基本一致，但模型变 
化多端，仅举一例作示范. 
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33 .设是随机事件，试用归纳法证明下列 公式: 

n 

P(^i U 乂 2 U • • • U 人 )= P{Ai) — ^ P(AiAj) 

i=l 

+ —… + (—l) n ~ 1 P(AiA2 - - - A n ) 

1 ^i<j<k^n 


提示：从 P(A U B) = P(A) + P(B) — P(AB) 出发 • 

【评注】这联系于数学中的一个基本公式，它在不同分支以不 
同形式出现，以不同的发现者命名，证法甚多，本题指定用归纳法 
证明，组合学中用容斥法证明，参看教学札记之四“一般加法公式 
及其推广”，《概率论基础》习题四1题提供另一种证明思路. 

34. 某班有 iV 个士兵，每人各有一支枪，这些枪外形完全一样， 
在一次夜间紧急集合中，若每人随机地取走一支枪，问至少有一个 
人拿到自己的枪的概率. 

解设次第 i 个士兵拿到自己的枪 = ，； V ， 


P(Ai) = 


(iV —1)! 1 

~ m ~ = n 


PiAiAj)= 


(TV — 2)! 

~" W \ ^ 


1 

N{N~- 1) J 




P{AiA 2 --A n ) = 

由 33 题的公式得“至少有一个士兵拿到自己的枪”的概率为 

P(A\ U A 2 U • • • U Ajv) 

N 

P (^) - E P ^ A i ) + • ♦ . + -- A N ) 

i=l 
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($- G ) 


N(N -1) 


+ ••• + 


(- 1 广 《3 士 


! + ••• + ( - 1 广 1 士 


N 

E 

/ c=l 


(一 1) 


k - 


k \ 


【评注】这是蒙特莫特 ( Montmort ) 问题（匹配问题）的另一种 
表述，常见的变形 还有： 两副扑克牌的配对，聚会中糊涂侍者错发 
衣帽，交换礼品时拿回自己送出的东西等. 

*35. 在上题中求恰好有 k (0 ^ k ^ N ) 个人拿到自己的枪的 
概率. 

解在 AT 个士兵中任意选岀 fc 个士兵来有种选法. 
一组指定的个士兵都拿到自己的枪的概率为 


N(N _ 1) … （N - k + 1) 

由34题 AT — A : 个士兵都没有拿到自己的枪的概率为 

! v (-ly - 1 v (_1)i 

1 卞 —T^ = ^i 

i=l /=0 

于是，恰好有 fc 个士兵拿到自己枪的概率为 


p (N\ 1 V (-iy 1 V (-以 

[k] \k J N{N-l)-^(N-k+l) 11 ~ k\ 4 ^ ^ 

l —0 

【评注】上题的一 般化. 算出一个完整的分布. 

36. 从一副扑克牌中有放回地一张张抽取，求在抽取第6张时 
得到全部4种花色的概率. 

解以4，禹, 4 3 ,烏分别记抽得的6张牌中有黑桃、红心、 
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方块、草花的事件，则得到全部 4 种花色的概率为 

P[A\A2A.^A4) = 1 — P{A\ U A 2 U A 3 U A 4 ) 

4 

= 1 -Em)+ E PiAAj) 

i=l 

- Y 1 PiAiAjAk) + P(A{A 2 MM) 



= 0.380 86 


【评注】利用对偶原理化交为并，巧用一般加法公式.本题是 
一类古典概型典型问题中较容易的一个. 

*37. 考试时共有 iV 张考签， n 个学生参加考试 （n > AT ), 被抽 
过的考签立刻放回，求在考试结束之后，至少有一张考签没有被抽 
到的概率. 

解不妨将考签编号为1,2, • • • ， iV ， 记事件次=彳第 i 号考签 
未被抽到}，则 


尸 ⑷ i = l ， 2，...，iV 
PiAiAj ) = n 2)7 \ i+j, i，j = l ， 2, …， AT 


P(A 1 A 2 ---A n )= {n ~^ )n ~ = 0 

易知，诸木相容，则可用本章习题 33 的公式，得 
至少有一张考签未被抽到 } 


= P(Ai U A 2 U • • • U A^) 

N 

= 5>(次)- E PiAiAj ) + … + (一 1 广 - ip (牵 先 • • • A n ) 

t=l 
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【评注】适用一般加法公式的题型之一.若改求每张考签都被 
抽到的概率，你将如何处理？ 

# 38.(赠券收集）食品厂把印有水浒108将之一的画卡作为赠 
券装入某种儿童食品袋中，每袋一卡，试求购买 n 袋这种食品而能 
收齐全套画卡的概率. 

解记 B ={ 购买的 n 袋食品袋中含有全套108将的画卡}， 
次={购买 n 袋食品已收集到第 i 张画卡 }, i = 1,2,…，108,则 


B^f]A i} B=(jA t 


并且 


P(Ai) 


(108- l ) 1 
108 n 




( 1_ 扇)' w 


视“ 8 )=迎^^ = 0 

因而 

P{B) = P{A\ U A 2 U • • • U i4io8) 

108 

=^2 P(i4i) — [ P(^i Aj) + • • • — P(A\ A 2 … A\os) 


Ki<j<108 


&-叫\ 08 )(1-鉦 


107 y 
108 / 
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于是 


P(B) = 1 - P(B) 


史 (- O -忐 r 

— n \ / 


【评注】经典问题，变形 甚多. 思考本题与前两题的 联系. 

*39. 用概率论想法求 iV 阶行列式的展开式中包含主对角线元 
素的项数. 

解设 N 阶行列式中元素为行列式展开式的每一项为 
不同行不同列元素的乘积，共有 AT ! 项. 

设表示事件 { 随机选一项其中含主对角线元素 a kk }, 

灸=1，2，-..，#，贝1』 


P(A k ) = 


(TV - 1)! 



1 

TV 


PiAAj ) = 


(AT — 2)! 

~ W \ ~ = 


1 

N\N^iy 


(i ^ 3 ) 


P { Al A 2 .^ A N ) = -^ 
任取一项含主对角线元素的概率为 


P(Ai U^ 2 U---UA n ) 

N 

= 53 p(Ai) - p ( A i A j) + ■•• + --a n ) 

t=l l<i<j ■彡 iV 





+ " . + (—1)^"" 




N\ 


• 31 . 





【评注】思路来自主对角线元素的两个足标是相互“匹配”的 • 
以上数题紧密联系一般加法公式，关于这个主题，可参考教学 
札记之四“一般加法公式及其推广”. 

40.有 w 只白球与&只黑球任你放入两个袋子中，让你的朋 
友随机抽一袋并从中摸出一只球，你将如何做以使你的朋友摸得 
黑球的概率最大. 

答一个袋放一只黑球，另一个袋放入 w 只白球和6 - 1只 
黑球. 

【评注】直观可得答案，证明较难.（提示：把 fc 彡只球 

放入一袋，其中有 : r 只黑球，写出摸得黑球的概率，再讨论: r 取何 
值时使上述概率最大 .） 

*41 .甲，乙，丙三人按下面规则进行比赛，第一局由甲，乙参加 
而丙轮空，由第一局的优胜者与丙进行第二局比赛，而失败者则轮 
空，比赛用这种方式一直进行到 其中一 个人连胜两局为止，连胜两 

局者成为整场比赛的优胜者,若甲，乙，丙胜每局的概率各为^问 

甲，乙，丙成为整场比赛优胜者的概率各是多少？ 

解若以 A 、 B 、(7 分别表示甲、乙、丙成为整场的优胜者，以 
a 、 b 、 c 分别表在一局中甲胜、乙胜和丙胜，则整场比赛的可能结 
果可表示为： 
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aa , acc ， ac 66 t acbaa , acbacc ， acbacbb ，… 



bb, bcc, bcaa, bcabb, bcabcc, bcabcaa, … 

于是有 

P { C ) — \ P { acc ) + P (6 cc )] + [ P ( acbacc ) + P ( bcabcc )] + … 

= 2 x ^+2 xi +2 x ^ + .-. 

2 
' 7 

由于甲、乙两人所处的地位是对称的，所以有 P ( A ) = P ( B ), 故得 

P ( A ) = P ( B ) = i(l-?) = A 

【评注】事件分析与概率计算训练题 之一. 

M 2 •父 ，母， 子三人举行比赛，每局总有一人胜一人负（没有和 
局)，每局的优胜者就与未参加此局的人再进行比赛，如果某人首先 
胜了两局，则他就是整个比赛的优胜者，由父决定第一局由哪两人 
参加，其中儿子实力最强，所以父为了使自己得胜的概率达到最大， 
就决定第一局由他与妻子先比赛,试证父的决策为最优策略（任何 
一对选手中一人胜对方的概率在整个比赛中是不变的）. 

证单局比赛有六种情况，记父胜子的事件为 F s ， 相应概率为 
P Fs . 对应地，子胜父记为办，概率记为 p 5f ； 父胜母记为概 
率记为 P Fm ;母胜父记为 M f ， 概率记为 p M F F ;母胜子记为 M S ， 概 
率记为;子胜母记为 Sm ， 概率记为 . 易见 + P Sm = 1, 
p Fs < p Fm . 若按父的决策首局由父与母 € 赛，则整个 S 比赛 &可能 
结果为 

FmFs ， FmSfSm ^ FmSfMsMf , FmSfMsFm 
MfMs ， MfSmSf ，^ fSm ^ sFm , MfSmFsMf 

故有 

Pi= 第一局父对母而父为整个比赛优胜者} 

- P { F M Fs ) + P ( F m S f M s F m ) + P ( M f SmF s F m ) 

= P F M P F S + P F m P S f P M s P F M ^ V M f 1 P S m P F S P F M 
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类似地有 

p 2 = 第一局父对子而父为整个比赛优胜者} 

= P { F s F m ) + P { FsM f S m F s ) + P { S f M s F m Fs ) 

= Pf s P Fm +P Fs P M f P S m P Fs +P S f P Ms P F m P F s 

P 3 = P { 第一局子对•母而父为整个比赛优胜者 } 

= P(SmFsF m ) + P(MsFmFs) 

= P S M P F S P F M + P M S P F M P F S 

= p Fs p Fm ( p Sm + p Ms ) 

= Pf s Pf m 

经比较易知 P 3 < P 2. 乂由于 ， 所以， 

Pf s P M f Ps m P Fs < P M f P S M P Fs P Fm 

Ps F P M S P F m P F S K P F m P S F P M S P F M 

因此有巧 < A , 从而 Pl > P 2> 这说明 
父的决策是最优策略. 

【评注】中学数学奥林匹克 赛题. 复杂事 
件分析与概率计算. 

43. 给定 p = P ( A ), q = P ( B)，r = P(AU 
B )， 求 P ( AB ) R P ( AB ). 

提示： 从文图出发. 

答 P ( AB ) = r _ q , 

P ( AB ) = 1- r . 

【评注】本题是举例性的，事实上给定三个概率 p ， g，r 即能算 
出有关 J 3 的全部 I 6 个事件（见本章习题 46 题）的概率 • 思考 
为什么？进一步可考虑推广到三个事件 AC 的场合. 

44. 设 Pl ， P2 , Pl 2 是给定的实数，试证存在两个事件 A 及也 



l-li 
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使得 P(Ai) = pi , P(A 2 ) = P 2 j P{A\A 2 ) = Pl 2 的充要条件是下列 
四个不等式同时成立： 

P 12 彡0 ， pi - P 12 ^ 0, p 2 一 P 12 彡0，1 一 Pi — P 2 + Pl 2 > 0 

证 必要性.设存在山及糸使得 P (^ l )= Pl , P (^ 2 )- P 2, 
P ( AM 2 )= Pl2 ，则 

0 < Pl 彡 1，0 < P2 < 1 ? 0 < P12 彡 1 

0 ^ P{A\ — A 1 A 2 ) = ~ P(AiA 2 ) = pi - P 12 

0 彡 P (^2 — A 2 A 1 ) = «P(v42) — P(A\A 2 ) = P 2 - P 12 
1 彡 P{A\ U-A 2 ) = 尸 (y4i) + P ( 乂 2 ) - P{A\A 2 ) = Pi + P 2 — P 12 
所以有 

P12 彡 0 ， Pi — P12 彡 0 ， P2 — Pl2 彡 0 ， 1 — Pi — P2 + P12 ^ 0 

充分 ft . 由第一个不等式知 

P 12 ^ 0 

再由另三个不等式得 

Pl2 > Pi + P2 — 1 > P12 + P12 - 1 

故又知 

Pl 2 ^ 1 
而 

0 彡 Pi — P12 彡 1 - P2 彡 1 - P12 彡 1 

类似得 

0 < P 2 — P 12 彡 1 

再用第四个不等式知道存在三个互不相容的事件 S ， C ， D 使 
P(B) =pi -P12, P(C) = Pl 2, P ( D ) = P 2 - Pl 2 
于是可令 

々 = £ + a 2 = c + d 
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即有 


尸(乂 1) = Pi - Pl2 + Pl2 = Pi 
P{M) = P2 — Pl2 + Pl2 = P2 

P(Ali4 2 ) = P{C) = Pl2 

【评注】事件域中诸事件的概率的给定要受各种约束. 

45. 证明： | P{AB) - P(A)P{B)\^ ^ 并讨论等号成立的条件. 

证 P(A)P(B}- P(AB) 

= P{A) [P(AB) + P(AB)] - P(AB) 

=P{A)P(AB) - P(AB)[l- P(A)] 

(P(A)P(AB) ^ P(A)[l- P(A)] ^ ^ 

另一方面（不妨设 P ( A )^ P ( S )), 

P{AB) - P{A)P(B) 

彡 P(B)~ P(B)P(B) = P(B)[l- P(B)] < i 

因此 

\P(AB) - P{A)P(B)\ ^ \ 

从上述证明可看到，要使 P(A)[l^ P(A)] ^ i 中的等号成立 

当且仅当 P(A) = 由对称性知 P(B) = 

由此可得出当且仅当 P(A) = P(B) = ^且 P(AB) = 0 即 

B = ：? 时，或者 P(AB) = ^ 即 S = 4 时所求证的不等式的等号 
成立. 

【评注】第四章§2将再回到这个不等式，并提供新见解. 

46. 求包含事件洚 S 的最小 a 域. 
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解数字0, 1可以表示两种不同的状态. 

若以 1 表示样本点 U 属于某事件，而 0 则表示不属于，则对 
两个事件 A S 会有2 2 == 4种情况，它们分别代表四个事件，这四 
个事件互不相容，就如同下表所示： 

A B _ 

1 1 表 7 K 

1 0 表示 >1 万 

0 1 表示 AS 

0 0表示 

现在考虑这四个互不相容事件 4 B ， AB ， AB , 这四个互不 
相容事件构成了全空间 D 的一个分割.为了找出最小 a 域，即其 
全体¥集，考虑事件“并”的运算，现在以1表示该事件参与“并”的 
运算，而0则表示不参与，这样就有2 4 = 16种情况，列于 下表： 


AB 

AB 

AB 

AB 



0 

0 

0 

0 

表示 

0 

1 

0 

0 

0 

表示 

AB 

0 

1 

0 

0 

表75 

AB 

0 

0 

1 

0 

表示 

AB 

0 

0 

0 

1 

表 7 K 

AB 

1 

1 

0 

0 

表不 

A 

1 

0 

1 

0 

表示 

B 

1 

0 

0 

1 

表示 

ABU AD 

0 

1 

1 

0 

表示 

ABUAB 

0 

1 

0 

1 

表示 

B 

0 

0 

1 

1 

表示 

A 

1 

1 

1 

0 

表 7 TC 

AUB 

1 

1 

0 

1 

表示 

AUB 

1 

0 

1 

1 

表亦 

AUB 

0 

1 

1 

1 

表示 

AUB 

1 

1 

1 

1 

表示 

S 2 
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因此，该 Ji :: I ' ，T 域为 {12, 0，洚 B ， 瓦 B ， AB , AB y AB , AB , 
ABUAB . AU AB . J £?, ]4 U S, ^4 U 5, Au S}. 

【评注】由事件 A ， S 把样本空间分割成 4 个不相容事件 AB , 
AB 7 AB , AB 之和，由它们生成的 2 4 = 16 个事件构成上述 cr 域. 
前面三题讨论了在这个事件域给定概率时会遇到的某些问题. 
请读者推广到三个事件隼 S ， C 的 场合. 

47. 证明：⑴ D 的一切子集组成的集类是一个 a 域； （2) a 域 
之交仍为 ex 域. 

证⑴记 多= { P 的一切子集 }• 

( 1 ) U 是的子集，所以12 € 多； 

⑻若4 e 多，即 A 是 D 的子集，则 I = I ? — A 也是的子 
集，所以 

( iii ) 若 A e i = 1 , 2 ,..., 则有八 c a 对任一 

oo oo 

a ； G [jAi, 必有某一 i 。， 使 CJ € 4i 。 C 仏从而有 [jAi C Q, 

»=1 i=l 

即 0 Ai 也是的一个子集，故 0 Ai e 

i=l i=l 

所以多是 a 域. 

(2) 设多 t ( t e r ) 是 a 域，记多 = 「| $• 

t^T 

(i) n g v< e r, 所以 e 厂| 爲，即 

ter 

( ii ) 若 >4 e 多，则 A e 舄 ， w e r . 由舄是 a 域得 
A e Vi e T , 所以 A e 厂 I 界，从而有 Ae 

teT 

( iii ) 若 4 e 多，名=1，2，---，贝|】 Ai e Vi GT . 由于罵是 

oo oo 

(7 域，所以 U 乂 i e 爲 ， vt e r ， 即 U 4 e n 只 = 炎 

i=l i=l t^T* 

所以多是^域. 
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【评注】这是《概率论基础》中用到的两个重要结论，特留给 
学生作为练习，有助于记牢 a 域的三个要求. 

48. 证明： 包含一切形为 (- cx ), x) 的区间的最小 a 域是一维 
博雷尔 a 域. 

证一维博雷尔 a 域涿= a {[ a y b )} 是由左闭右开区间类产 
生的 (7 域. 

设溪 = a {(- oo , x )} 是由形如 （- 00 , 2 ：) 区间类产生的 a 域. 

因为 [ a , b ) = (一 oo ，&) 一 (- 00 , a ), 溪是 a 域，所以 [ a ,6) € ^ , 
因此有 潘 d 

oo 

又由于（-00, X ) = (J [x - n，：r 一 n + 1)，溪是 a 域，所以 

n=l 

(- CX ), X) e 因此有滠 C 涿. 

于是有虿=涿. 

【评注】这也是《概率论基础》中反复用到的一个论断，通过 
完成本题，学生将对博雷尔 a 域涿有进一步了解. 

49. (1) 设 Q 是定义在 a 域上的非负广义实值函数（即可以 
取有限或无限值的函数)，如果它具有可列可加性，并且 Q (0) = 0, 
则称 Q 为测度，试说明测度概念是算术中计数概念及几何中长度、 
面积、体积等概念的 推广； （2) 用测度概念解释古典概型、几何概 
率及概率论公理化结构中关于概率的定义. 

答 （1) 由 Q (0) = 0及测度的可列可加性易得测度具有有限 
可加性. 

算术中的计数•以 n (£；) 表示 集合五 中包含的元素的个数. 

⑴ n ( E ) 非负； 

(ii) 若 Ei ， i = l,2，. . ，1 中任意两个疚 与 Ej _ j ) 之间都 

i i 

没有相同的元素，则 n ^ Ei ) = ^ n (£；0, 即集合的和包含的元 

i=i i=i 

素的个数等于各个集合包含元素个数的和，也就是说 n ( E ) 具有有 



限可加性； 

( Hi ) 若 E = 0， 它不包含任何元素，则有 n (0) = 0. 

几何度量中的长度.以 m(E) 表示区间的长度. 

( i ) m{E) 非负； 

( ii ) 对区间私 ， i = 1,2,… ，若任 意两个 及与马 (i ^ j ) 都不 

oo oo 

相交，则 rn^Ei) = ^2m(Ei), m(E) 具有可列可 加性； 

t=i t=i 

(iii) 空集 0 的长度 m(0) = 0, 

当区间改成平面或空间区域，长度改成面积或体积时，以上结 
论仍成立_ 

非负性，可列可加性，空集对应的值为零，这些是算术中计数 
概念和几何学中度量衡概念所共有的性质，因此可以看到测度概 
念是上述这些概念的推广. 


⑵古典概型中概率的定义：设 O = {0^，0； 2 ,…，叫}， 


VA c Q , 定义其概率为 P ( A ) = 


A 包含的样本点数 
n 中样本点总数_ 


p 具有非 


负性,有限可加性， P (0) = 0. 此处的概率 P 相当于算术中的比例， 
只是 P 还有规范性，即 P { Q ) = 1. 古典概型中的概率实质上是定 


义在多=的一切子集}上的具有规范性的测度. 

几何概率的 定义: 设与 VG C P 都是 （ n 维欧几里得空间 

的）可测集，对 G 定义其概率为 P { G ) = 其中 m ( G ) 表示 

区域 G 的测度，可见 P 具有非负性，可列可加性，此外 P (0) = 0, 
P ( f 2) - 1,所以 P 是定义在 I ?中可测集上的具有规范性的测度. 


在概率论公理化结构中，定义在事件域多上的集合函数 P ， 
若满足 


⑴非 负性： P ( A ) ^ 0, VAe ^； 

( ii ) 规范性： P ( f 2) = 1; 

( iii ) 可列可加性：若 A €多 ， i = l ，2, …， A t Aj = 0, 么则 
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p ( I >)= Ep ⑷， 

i=l i=l 

那么称 p 为多 上的概率，由这三条性质可推得 P (0) = 0,因此可 
知定义在多上的概率 P 实质上就是定义在多上的规范性测度. 
【评注】简直可以看作本章的小结！ 

30. 试证: 概率定义 1.5.2 中的三个要求可用下列两个要求 代替： 

( i ) P{A) ^ 0,对一切 

oo 

( ii ) 若次 € 多 ， i = 1，2,…，两两互不相容，且 

i=l 

i=l 

证概率定义的三个条件为 

① 非负性： P(A) ^ 0, 

② 规范性： P{f2) = 1; 

③ 可列可加性：若次€多 ， i = l ，2 , …， AiAj = 0, 则 

i=l i=l 

显然①与 （ i ) 是等价的， • 

oo 

若4 e 多 ， i = 1,2, - v , 两两互不相容，且=仏则由 

i=l 

② (2) 可推得1 = P{Q) = Pif^Ai) =它尸⑷，即 ( ii ) 成立 • 

i=l i=l 

反之，当⑻成立，则由 r ? = r ? + 0 + 0 + …可得 p (0) = o ? 
P(f2) = 1,因此②成立，再由12 = S + S + 0 + 0 + …可得 
P(B) + P(B) = 1•若 V A G 多 ， i = 1，2,…，且两两互不相容，则/ 

oo oo oo oo 

因 = a 由⑼可得 y^p(Aj) + aA = i ， 加 
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上前证 f ( X ^ (它 Ai ) = 1，所以有 P ( f ^ Ai ) 戶⑷， 

t=l i=l t—1 1=1 

即③可列可加性成立. 

【评注】介绍公理备择形式，训练学生论证能力. 


习题总评 


第一章习题的训练重点是事件分析与概率计算，主要结合古典 
概型与几何概率进行.古典概型约20题,前三分之二用直接法，包 
括众多不同 类型； 后三分之一用公式法，大体是一些名题.几何概 
率共计7题，也包括了常见的类型.总的说这两类习题都有一定难 
度，不是懂得定义就能做出来的，而是充满技巧性，对学生而言，是 
有趣而艰难的训练. 

其他题目则紧扣教材，完成它们有助于掌握本章的有关知识. 

1童后小议] 


本章最后给出了概率论这一学科最基本的两个概念——事件 
与概率的严格定义. 

事件的定义建立在集合论的基础上，而概率则经过细致的考 
察后定义成规范化测度. 

三个具体概率模型被仔细研究 . 1°同样条件下的大量重复试 
验（尚欠严 格)； 2。古典 概型; 3。几何概率. 

有两种办法讲授概率的定义： 

第- 种，立刻给出概率的公理化定义，然后作为特例讲古典概 
型、几何概率以及其他模型.优点是直入主题，节省时间. 

另一种则是《概率论基础》采用的 方式： 从古典概型、几何 
概率等具体模型人手，最后引导到近代的公理化体系.这种做法可 
以让学生在简单场合感受概率直观和得到更多解题技巧训练并增 
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添课程的趣味性，也使本学科对青年学生更有吸引力. 

从古典概型、几何概率、统计定义出发讲概率论，最初见于格 
涅坚科《概率论教程》 • 《概率论基础》继承这个体系并有所发挥. 

鉴于概率的统计定义有诸多缺陷，《概率论基础》有意回避统 
计定义一说，但强调频率稳定性，并以三大实验性例子为证，说明 
概率的客观性，同时把频率与概率的关系贯穿全书. 

对古典概型及几何概率,《概率论基础》从正文到习题都有较 
齐全的配置. 

为定义概率论的基本概念， a 域，特别是欧几里得空间上的博 
雷尔 a 域是不可或缺的概念，书中只对其作适可而止的处理. 


教学札记之 


浅谈集合的大小 

现代概率论建立在集合论的基础上.样本空间 O 是样本点的 
全体构成的 集合; 事件域多定义为样本空间的某些子集构成的集 
类; 概率则定义为多上的规范化测度. 

概率问题的复杂程度及其所使用的数学工具的高低都跟所要 
处理的样本点的集合的大小有关系，因此样本空间实际上是按集合 
的大小归类的——有限，可列， R 1 ，R 2 , ……等等 • 

概率论处理的样本空间，多数是无穷集合，因此有必要对集合 
论的相关内容作些介绍. ’ 

集合论于19世纪70年代由德国数学家康托尔 ( G.Cantor, 
1845-1918) 创立，现已成为数学各学科的公共基础， 

集合论研究“无穷大”，也使人类对实数的理解大大深入. 

无穷大的概念困惑数学家与哲学家达2000年之久，到康托尔 
才获得突破,得出许多令人意外的结论. 

从亚里士多德开始，只承认{1，2,3，“.}的“潜无穷”，不敢承 
认[0, 1] 中的点的“实无穷”，直至19世纪上半叶，甚至大数学家 
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柯西、高斯等人也不敢对无穷大作深人探讨. 

一些现象令人费解.例如自然数可与其平方数一一对应，但后 
者明显少于 前者； 又如从圆心向两同心圆画出半径可建立两圆周 
上点的一一对应，但大圆的长度显然大于 小圆； 最简单的 ， y = 2 x 
把[0, 1】的点一一对应于[0, 2] 的点. 

在有限的场合比较大小，显然局部小于整体，但在无穷的场合， 
并不如此. 


康托尔用一一对应来比较集合的大小. 

在有限场合，集合的大小能用某一个自然数来表示，与常识完 


全 一致. 

若有 n 个元素，则它有个包含 fc 个元素的子集，还包 

含一个空集，一个全集，也都算子集，因此其子集全体构成的集类 

共有 G ) + ( 1 ) + ( 2 ) + •••+(„) = 2 n 个元素，也还是有限集 • 

在无穷场合，则发现有各种无穷大，康托尔用势 （ power ) 来 
表示. 


1 . 记自然数的势为心（读阿列夫零)，此为第一级无穷大，称 
为可列或可数. 

2. 偶数与自然数同势. 

3. 整数也与自然数同势. 

4. 可列个可列仍为可列. 

图 1-12 中可列个可列集中的元素依对角线顺序重新排列即可. 

5. 有理数是可列的. 

有理数表示成分数，以图 1-13 方式排列（可能有重复)，按对角线 
顺序重新排列即可. 

6. 实数全体是不可列的. 

[0,1] 中的每个实数可用无穷小数 0. a ia 2 a 3 ( z 4 …来表示（为 
使表示法唯一，规定 0.3 表示为 0.2999 …，余类 推). 为证明 [0,1] 
中的实数是不可列的，用反证法.设[0，1]中实数全体可排列成 
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0*^21 ° 22 ^ 23^24 * * * 
O.flW 33 034 … 
0 fl 4l a 42 fl 43 a 44* ' 


取 b = 0 Mb 2 b 3 b 4 …，其中 h # 叫，显然 b 为[0, 1] 中实数，但与 
上列各数都不同,得出 矛盾. 故证得 [0,1] 中实数全体是不可 列的. 

[0,1] 中的点可用= tan ( x - 同（一 oo ’ oo ) 建立 -对 

应，故知 R 1 是不可列的 . R 1 的势记为 C ， 称为连 续统， 显然它是 
比心更高级的无穷大- 

7. 无理数全体不可列 • 

8. 二维欧几里得空间 R 2 的势也是 C . 

只需注意到 

/ xi = 0_aia3 • • • 
x = 0.aia2fl3^4 • • •( 

\ X2 = 0_fl2 a 4 • • • 

建立[0，1]与 [0， l ] x [0， l ] 的一一对应 • 

9. n 维欧几里得空间 R n 的势也是 

10. 2 Ho = C . 

[0,1] 中的数可用二进制表示为 0 Mb 2 b 3 b 4 …， 其中 
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其势为 C ; 另一方面，这个表达式又可以理解为一个含有可列个 
元素的集合当它的第 i 个元素选人子集时\用1表示，不选人子 
集用0表示，0, 1的所有选法对应其子集全体，故它构成的集类之 
势为2〜，这二者一一 对应. 

11. 集合 A 的一切子集之势高于 Z 的势.因此势也是无穷的. 

概率论只讨论到样本空间的一切子集所构成的集类这一级，不 
算太难. 

基础概率论中用到的样本 空间仏 

(1) 有限样本空间， P 的势为 n ， 其一切子集之势为 2 n . 

(2) 可列样本空间， I ?的势为心，其一切子集之势为 2 ^o = 

(3) 欧几里得空间 R 1 , R 2 , R n , P 的势为 C , 讨论的子集类限 
于博雷尔 a 域. 

在有限样本空间，概率论所用数学工具只是初等数学，在可列 
样本空间还用级数，但在欧几里得空间则广泛使用微积分的各种 
知识. 


教学札记 

排列组合辑要 


一、排列、组合公式 

1. 乘法原理：完成一件工作需经两个过程，进行第一过程有 TM 
种方法，第二过程有 n 2 种方法，则完成该工作共有 m x n 2 种方 
法.显然可把上述结果推广到多个过程的场合. 

下列公式的推导只基于这个原理. 

2. 排 列：从 n 个不同元素中任意选岀 r 个元素排成•-列.既 
考虑元素，也考虑顺序. 

重复排列数 （ r 个元素不相同、有部分相间或全部相 同)： 
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选排列数 （ r 个元素均不相同): 


= n(n — 1) • • • (n — r + 1 )， 1 < r ^ n 

选排列的特例 ： r = n 时称为全排列， 


P n — n !, 定义0! = 1 

显然有 . 当 r > n 时，定义= 0. 

(n — r )! 

3. 组合：从 n 个不同元素中任意选出 r 个元素.只考虑元素， 
不考虑顺序. 

组合数 （ r 个元素均不相同)： 



r n(n — 1) … （n — r + 1) 



r! 


1 ^ r ^ n 
r > n 


定义⑺ = L 

重复组合数 （ r 个元素中可以有相同 的): 

耐 T 1 ) 

4. 小结： 排列、组合公式归纳如下 



重复 不重复 

排列 


组合 

rr 1 ) o 


排列与组合的分类不能绝对化，例如两类元素的全排列等价 
于组合. 

二、两类典型问题 

1. 抽样（摸球)：从 n 张卡片中抽取 r 张. 

抽样有两种方式：放回，不放回. 

对结果有两种记录：讲序（有序)，不讲序（无序). 
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从 n 张卡片中抽取 r 张可能结果总数列于 下表: 



放回 不放回 

有序 


无序 

me ) 


2. 分配（占位)：把 r 只球投入 n 个房间. 

每个房间容球的规则：不限制，有限制（只限一球). 
球的 个性： 可分辨（编号)，不可分辨. 
r 只球投入 n 个房间可能结果总数列于下表： 



不限制有限制 

可分辨 
不可分辨 

r ’ r 1 ) 0 


把 r 只球投入 n 个房间还有另一种表述. 

若以向量 ( ni , n 2,*-- y ^ r ) 记第 i 只球投入的房间号码为 ni ， 
i = ， r ， 并称为房号向量.再以向量 (^ 1 ^ 2 ,- • - , r n ) 记第 j 

号房间落入的球数为 j = 并称为球数向量，则可能 

的向量总数列于下表 •. 



不限制 

有限制 

房号向量 

n r 


球数向量 

rr 1 ) 

0 


三、重复排列 



1. 中国人很早研究有重复排列与二 进制： 《易传 • 系辞上传》: 
易有太极，是生两仪，两仪生四象，四象生八卦.”传说周文王演八 


• 48 . 




卦，成六十四卦. 

2. n 位二进制数即 (xi,x 2 , - - - ,x n ), 其中 a：i = I j 5 计有 2 n 个. 

3. 含有 n 个元素的集合的子集总数为 2" 个. 

4. 彩票摇奖器当众摇出一个 6 位数的中奖号码（可从 000 000 
到 999 999), 共有 10 6 种可能结果. 

5. 掷一颗骰子 4 次，共有 6 4 种可能结果,掷两颗骰子 24 次共 
有 36 24 种可能结果. 

6. 从装有编号为 1 到 n 的球的袋子中有放回地摸岀 r 只球， 
依次记下其号码，可能总数为 V . 

7. n 个人的生日（以每年 365 天计）共有 365 n 种. 

8. 公共汽车上的 r 位乘客在以后的 n 个站下车的方式计有 n 7 * 
种. 

9. (麦克斯韦-玻尔兹曼统计） n 个可分辨粒子在相空间的 AT 
个相格屮的可能分配有种. 

四、全排列 


P n = n(n — 1) • • • 3 • 2 _ 1 

1. n 卷文集在书架上的排列方式有 n ! 种. 

2. 把 n 个客人分到 n 个房间共有 n ! 种安排法. 

3. 把编号为 1 到 iV 的球从袋中一只接一只摸出依序排成一 
列，共有 AM 种不同结果. 

4 . 把 n 封信分别装人 n 只信封共有 n! 种结果. 


五、选排列 

A n = ( n )r =咖 - 1) … (n - r + 1) = 


1 < r ^ n 


1 .从 n 种牙膏中选 r 种依序上货架，共有 < 种不同排列. 
2•把 r 个客人分到 n ( n ^ r ) 个房间，共有 < 种安 排法. 
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3 .把 n 只可分辨的球投入 TV 个房间，若每个房间只容一球， 
且 n < iV ， 则有种分配法. 


六、组合 




r ! 


n(n 一 1 ) … （n — r + 1) 
r ! 


n ! 

r ! (n — r )! 


主要性质： 

杨辉恒 等式: ⑺ o (:). 

图 1 - 14 摘自杨 辉《 详解九章算法》(1261)， 

该书注明“贾宪用此术”.贾宪是11世纪前半 1 2 

叶北宋数学家.帕斯卡于1654年完成论文《论 11 

算术三角形》，故西方称为帕斯卡三角或算术三， W 1 , 
角形. 1 4 6 4 1 

定义0 = 1，则 1 5 10 10 5 



0 ^ r ^ n 



二项式 ： （a + 6 ) n = 



a k b n ~ k 


令, 一 丄，得 Q 普(;) + ... + ( : ) =2 、再次表明 

含有 n 个元素的集合的子集总数为 V . 

常用公式： 



1. (抽样）从 n 个不同元素中取 r 个不计顺序,其总数为 

2. (分割）把 n 个物体分为两类，第一类 r 个,第二类 n _ r 个， 
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分法共有 


(:) 


种. 


•类，则不同的全排列数为 


. (两类元素的全排列） n 个元素中有 r 个是一类 ， n - r •是另 

n! = ( n \ 
r!(n-r)! \r J 

4. (二项系数）二项展开式 (l + x) n = J " ( T )/ 中 f 项的 

k=o ^ ' 

系数为 (:). 

5. (占位） r 个黑球在排成一行的 n 个位置上有种放法. 

6. 连投 n 次篮球有 r 次命中共有种方式实现. 

7. (费米-狄拉克统计） r 个不可分辨的粒子在 n 个量子态（每 
个量子态至多有一个粒子占据）中的分配数为 


当 fc 


七、多项系数 

( 71 )= — ^ — ， 
Vn ，， 2, … 、 r k J ri\r 2 \--r k \ 

= 2 时化为二项系数. 


ri + r2 H - \-rk = n 


1. (抽样）从 n 个不同的元素中取 n 个构成第1组， r 2 个构 
成第2组，……，剩下的以个构成第 fc 组，计有^种. 

2. (分割）把 n 个物体分为 fc 类，第一类 n 个，第二类 r 2 

个， . ，第 fc 类 nt 个，这里 ri + r 2 + * * • + r fc = n , 则分法共有 

——-——种. 

ri!r 2 ! … rj 

3. ( k 类元素的全排列） n 个元素中有 n 个是第一类， r 2 个是 
第二类，……，〜个是第 fc 类，+ r2 +…+ rfc = n ， 则可分辨的 

全排列数为~~ 

ri!r 2 ! •••?>! 
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4. (多项系数）多项展开式 


(xi + a：2 H - h Xk) n 


E 


n \ 


ri+r 2 H - \-r k =n 


ri ! r 2! • • • ! 




中圩斤项的系数为 


n! 


ri !”2! … 


/ V 、重复组合 

记从 n 个不同的元素里，每次取出 r 个元素的有重复的组合 
的总数为则 

耐 ，- 1 ) 

1. 多项展 幵式： 


(ai + a2 + — + a n ) r = 


E 


r! 


Fl+ 广 2 H - hr n ： 

0< ri<r 




…心 


^ 个同类项. 

特别地， （ a + 6 广 =Z ( QaV -* 共有 r + 1 个（同类）项. 

0<fc<r 乂 / 

证明 （归纳法） 
n = 1, ff [ = Q = 1. 

n = 2 , ^ 1 j = r + 1, 即上述二项式. 

若= ( n + 二 — 2 )，则丑；；种选法中，从原 n - 1个元素 

中选出的共有 H^_ x = ^ n + [ _2 j 种，余为加入新元素，新元素 
可以出 l ，2，...， r 次.当新元素出 i 次时，另外 r - i 次从原 n - 1 
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个元素选出，计有 / f ；； Zi 种 ， i = 
H r n = H r n ^ + H；-] + H r n Zl 


1 ， 2 ,…， r ， 故 
+ ••• + ^ + 1 



从而证得结论. 

2 . 满足不定方程 xi + a：2 + • • - + x n = r , 0 < Xi ^ r , i = 
1 ， 2 , …， n 的非负整数解 ㈨ …，…， x n ) 的组数 为毋. 

证明 （ 0 - 1 序列） 

当 A 取非负整数 fc 就用连排的 A ： 个 1 表示，加号用 0 表示， 
则方程化为 r 个 1 与 n - 1 个 0 的排列，每种排列对应方程的一组 

解，由两类元素的全排列数知计有 0 组，从而证得结论. 

3. 从1，2,3,…， n 中有放回地选 r 个数，计有％种选法. 
证明（重复抽样） 

把选出的数依大小排成 ai ^ a 2 < a 3 ^ ^ a r , 当然其中可 

能有些数相等.作如下变换:从第二个数起分别加1,2,3, . 

即得 


5 «2? 勿， …， CL r 

+ _ 1， 2， …， r-X 

bl ， &2, 办3， •••， K 


显然 61 , 62 ? h ， …， b r 不等 • 

从 1,2,3,-•• , n 中有放回地选一组数 ai , a 2 , a 35 ••- , a r 与从 
l ，2,3，.-.， n，n + l，-.、n + r-l 中不放回地选一组数 b u b 2 ，b 3 , …， b r 


是一一对应的，后者共有 


ti + r — 1 


种选法，从而证得结论. 


r 
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4. (玻色-爱因斯坦统计） r 个不可分辨的粒子在 n 个无限制 
的相格中的分配总数为％. 

证明（投球入格） 

若以0表示球，用丨 | 表示房间，则 r 个球在排成一列的 n 个 
房间中的分配相当于 r 个球与 n - 1根棒的排列（因为可以省去两 
端的棒),选定球的位置或棒的位置都可确定一种排列法，计有 

fn + r — /n + r — 1\ 

\ r ) = { n-1 J 

种选法，从而证得结论. 

九、 fc 类元素的抽样数 

1. 袋中有 M 只黑球， N - M 只白球，从中摸出 n 只，则有 fc 
只黑球、 n - fc 只白球的构成方法计有(二)(二二 f ) 种. 

2. 袋中装有 i 号球 M 只 ， i = l ，2, …+ + + ^ = 

N ， 从中摸出 n 只，则有 i 号球叫只 ， i = 1，2,…， fc ， ni + ri 2 + --* + 

n k = n 的构成方法有門門 • • • 門种. 

\riij \n 2 J \n k J 
3 •若 n + r *2 + …+ r > = n ，则 



nl 

ri!”2! • • • r>! 


教学札记之 d 


对称性与概率计算 

归根到底，概率论肇始于如下认识：对称事件其发生的可能性 
相等.因此发掘对称性是计算概率的一种特殊技巧，下面是一些例 
子. 
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一、 n 只球在 n 个位子的全排列 

(1) 1 号球出现在1号位的概率为 i ， 由对称性，1号球出现在 

n 

第 fc 号位的概率也为1，更进一步，第 i 号球出现在第 fc 号位的概 

n 

率也为这是不放回开锁问题的答案. 
n 

(2) fc 号位由预先指定的某号球占据的概率为^ 

(3) 袋中有 ci 只黑球&只白球，从中一只只摸出球，则第 fc 次 

摸得黑球的概率为_%，与顺序无关，这是抽签问题的答案. 

a + b 

(4) 在 n 封信与 n 只信封的匹配中，1号信装入1号信封的概 

率为 i ， 由对称性， i 号信装入 i 号信封的概率也为\ 
n n 

1，2号信与信封符合的概率为 i • - L -, 由对称性，第 i ， j 号 

n n — 1 

信与信封符合的概率也为 - p - 1 - 

n(n — 1) 

1, 2,3号信与信封符合的概率为 i 故第 i ， j ， 

n n - 1 n — 2 

k 号信与信封符合的概率也为 —( ~~^~~& 

n(n — l)(n — 2) 

以上结果用于匹配问题的解题中. 

(5) 袋中有 a 只黑球和&只白球，从袋中每次摸出一只球，直 
到袋中剩下的球全是同色球为止，求袋中剩下的球全是黑球的概 
率 • 

解 这是题集中常见的一道“烦题”，事实上其答案一目了然. 
记 A = 彳剩下的球全是黑球丨，{最后一只球是黑球丨，不难验 
证 A = 5，由对称性得 P ( B ) = 一故 P { A ) = 一 

CL 0 (Z + 6 
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—— u I, j-V-、rrt 

>、抽样调査 


(1) 从 iV 张卡片中任取一张，1号或 fc 号卡片被抽到的概率均 

为丄 
’ J N. 

(2) 从 iV 张卡片中任取两张，1，2号卡片被抽到的概率为_ • 
x 2,由对称性，预先指定的 A ; 号与 j 号卡片被抽到的概率 

亦为 

(3) 从 iV 张卡片中任取 f 张，预先指定的 k i 2 ，…，^号卡片 
被抽到_軸 g = 寧 —二 N — l + iy 航綱，在 

抽样中 ，/ 张卡片一张张被抽出与一次性抽出 Z 张卡片是等价的. 
上述结论在抽样调查的计算中经常隐性使用. 

(4) 袋中有 a 只黑球 6 只白球，从中摸出 n 只，有 fc 只黑球的 



概率为 



，即超几何分布. 


(5) 甲袋中有 a 只黑球 b 只白球，乙袋和丙袋都是空袋，先从 
甲袋中随机摸 n ( l ^ n^a + b ) 只球放入乙袋，再从乙袋中随机摸 
m ( l ^ m ^ n ) 只球放入丙袋，最后从丙袋中任取一球，求该球为 
黑球的概率. 


这也是题集中的一道.没有任何一只球比别的球更有机会成 
为最后从丙袋中取出的球，由对称性可知答案为 


三、掷硬币 

(1) 甲有 n + 1枚硬币，乙有 n 枚，求甲掷出的正面数超过乙 
掷出的正面数的概率. 
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解 设乙掷出 fc 个正面，甲掷出 fc + f 个正面， Z ^ l , 


则 


n+l 


/>{ 甲正 > 乙正} = 士乙2： 

i=l fc=0 
1 n+l n 


n + 
fc + Z 


0 (:) 


22n+l 


22n+l 


(=1 fc =0 
n+l 

E 


n + l 
n + l — k 


0 (：) 


2 n + 1 
n + 1 — l 


1 n 


f 2 n + 1' 


22 n+l 



如果熟悉组合系数的计算，这个通用解法也不能算太难，但利 
用对称性则能很快得到答案. 

记 甲正〉 乙正}， B ={ 甲反〉 乙反}，显然 A 与 S 称， 
故 P ( A ) = P ( B ). 

在甲只比乙多一枚硬币的条件下（只有这种特殊情况下才有 
此特殊解法!)， B ^ A , 因此又有 P ( A ) + P ( B ) = l ) 即得 P ( A ) = i . 

1965年我为复旦大学数学系67届数学专业两个小班上概率 
论课，同学们提出约十种不同的解法得岀本题的答案 I 多数正确， 
少数错误.其中的一种错误做法是：前 n 个对 等，. 因此甲能否超出 
决定于最后一枚硬币，它出正面的概率为^ 

(2) 掷硬币 2 n + 1次，求出现的正面数多于反面数的 概率. 

解 问题不同，但有相似的解法. 
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记正面数 > 反面数}，反面数 > 正面数显然 B = 
A , 另一方面由对称性知 P ( A ) = P ( B ), 故 P ( A ) = 

(3) 甲有 n + 2 枚硬币，乙亨 n 枚硬币，投掷后比较，求>1={甲 
正 > 乙正 } 的 概率. ’ 

解若记甲反 > 乙反}，由对称性仍有 

尸⑷= P ( B ) 

但这里 AS / 0，不过由于 A 5 = 0，故知 P{A UB ) = P { Q ) = 1, 
又 

AB = { 甲正 > 乙正，甲反 > 乙反 } 


故 


由 


得到 


= { 甲正-乙正=1，甲反-乙反= 1} 
={ 甲正—乙正 =1} 


n 


P ( AB ) = P { 甲正 = fc + 1,乙正= A :} 

n + 2、 


/c=0 

n 


SG: 獅 

A ( n + 2 \/ n \ 

AU + l-fc 八 fcj 


2ti+2 


k =0 

r 2 n + 2 


22n+2 


n +1 J 2 2n + 2 


P ( A ) + P ( B ) - P ( AB ) 


P ㈤ = 3 


'2 n + 2、 
n +1 

22n+2 
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四、 投点排序 

(1) 在线段 AB 上任投 3 点 a ： l ， X 2, 0； 3 ,求: T 2 落入 A 与 ： r 3 之 
间的概率. 

解记 Ai ={ Xi 落入 a ：2 与 X 3 之间}， A 2 ={ X 2 落入 a 与 x 3 
之间}， A 3 ={ x 3 落人与 x 2 之间 }， 显然乂 1， A ， 如是对称的，其 
发生的可能性相等，又 A 2 , A 3 两两不相容且 P ( A i U ^ 2 U ^ 3 ) = 

1，故 P { A 2 ) = 

(2) 在线段 AS 上任投 3 点 Xi , X 2, X 3, 求事 i 牛 {xi < X 2 < x 3 } 
发生的概率. 

解类似上题，记 

Ai = {xi < X2 < X3}, A2 = {xi < X3 < X2} 

A3 = {X2 < Xi < X 3 }, A4 = {x 2 < X3 < Xi } 

- {X 3 < Xi < X2}, = {X3 < X 2 < Xi} 

它们对称且两两不相容，又 i 4 i LM 2 LM 3 U 儿1 U U 烏发生的概 

率为1，因而 

P { M ) = P{xi <X2 < Xs} = ^ 

(3) 在线段 AS 上任取 n 点： r l 5 的，…， rr n ， 则事件 

{ x ix < Xi 2 < ••• < Xi n } 发生的概率为 

在数理统计中，把 A , &，•••，〜推广到独立同分布场合，这 
类技巧甚为有用. 

五、 顺序统计量 

(1) 按学生名单，以随机顺序抽出 n +1 个人，则最后一个人比 
其他人都高的概率，由对称性应为 

n + 1 

本题也常用运动员成绩破纪录来叙述. 

(2) 从学生中随意找13个人称体重，依次记为 A ， X 2 , …， 
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义 13 , 求 msx [ X u X 2 , … ， X 10 ) < xmn { X lu X l 2 , X l 3 ) 的概率 • 

解依对称性看作 13 个不等数的排列，计有13!种，其中10! • 
3!种满足要求，故所求概率为 


10!3! 
"13 T = 


286 


以上两题曾分别作为中国科技大学概率论与数理统计专业研 
究生的人学试题. 


(3) 随机抽取的 n 个学生中，第 i 号与第 j 号是最矮二位的概 


率为 


©• 


(4) 随机抽取的 n 个学生中，第一个人次矮，第 n 个人最矮的 


概率为 


n(n — 1) 

换一种说法，对一件倒霉事（例如金钱损失）去问一批朋友，直 
问到第 n — i 个人才发现一个比自己更倒霉的，这事发生的概率为 


^ rry 这被费勒称为倒霉事的持续时间，并指出其期望值为无 
穷大 • 


(5) 甲班有 M 个男生，乙班有 AT 个男生，把他们依身高分别 
排成义 ㈤ < 々 M ) <… < 及< … < 4 N) ， 
求 y n (iV) < X ^\ 的概率 • 

解用对称性， M + TV 个身高在编号为1，2, •…， Af + AT 个 
位子上的全排列是等概率的，为使上式成立， X { J ^\ 应出现在第 
n + m + 1 个位子上，它之前有 n 个 m 个 x \ M \ 它之后有 
7 V 一 n 个 Y ^ n) 及 M - m - 1个 x \ M \ 故所求概率为 
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教学札 记之四 I 

一般加法公式及其推广 

一、一般加法公式 
概率加法公式 

P{A UB ) = P { A ) + P ( B )- P { AB ) 

有非常直观的解释：为计算事件 AUB 的概率,对包含在 4 US 中 
的每个样本点必须计算一次，也只需计算一次. 

等式右边正是如此，前两项把 AUB 中的每个样本点都计算 
到了，但含在中的样本点却被重复计算，因此在第三项中扣除， 
从而达到对4 US 中的每个样本点都精确计算一次. 

在三个事件 A , B ， C 的场合，概率加法公式为 
P(A UBUC ) 

= P ( A ) + P ( B ) + P ( C )- P ( AB ) - P ( BC ) - P ( CA ) + P ( ABC ) 

这时，若样本点 o ； 不属于 A ， B ，（7 中任一个，则在右边诸项中均 
不出现，未被计入左边概率：若样本点 o ; 只属于 A 5, （7 中某一 
个，则在右边头三项中必出现且只出现一次，而在后边诸项中不再 
出现，因此正好计算 一次; 若样本点 o ; 属于 A C 中的某两个， 
则在右边头三项中被计算了两次，在中间三项被扣除一次，在最后 
一项中不岀现，也正好计算 一次； 若样本点 u ； 属于 ABC , 则在右 
边头三项中被计算三次，在中间三项中被扣除三次，最后一项中又 
计回，因此也同样被计算概率正好一次.这种证明方法被称为“容 
斥 （ inclusion - exclusion )法” • 

对事件山,七，…，人，记和式 

S2= P ( A i A j) 


_ 6J • 




Ss = nAiAiAk ) 


S n = P (^ x^2 - • • AO 
一般加法公式是上述加法公式的一般化. 

定理1 (—般加法公式）若4 1 ，也，".，4为11个事件，则 
P \ = - P (^4 i UA ^ U . • . UA n ) = Si — 152 + 33 — • ■+(—(1) 


这是《概率论基础》的 （1.5.9) 式，该书又把它编入习题一 33 
题，要求读者用归纳法证明.在学过更多概率论知识之后，在习 
题四1题中将会提示它的另一种证明思路.下面我们将用“容斥 
法”来给出它的第三种证明.如果你已读懂上述特例的证明，那么 


下面的证明便不难理解. 

证明若样本点 o ; 属于 Ai , i 4 2 , ■•- , A n 中的 m (1 彡 m 彡 n ) 
个，则在第1个和式中它被计算(^ 7 ^)次,在第2个和式中被计算 

0次 ，在第3 个和式中被计算次，……，在第 m 个和式 

中被计算次，在之后的和式中不再出现，因此在⑴的右边 
一共被计入 



二、 n 个事件中正好发生 A : 个的概率 

定理2 若以 B k 记事件 A u A 2 r -, A n 中正好发生 k(k = 
0,1，2, • • • ， n ) 个这一事件，而以 Q 记事件^1,^2,中至少 
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发生 A: 个这一事件，则 
P [ k ]^ P { B k ) 

= & - 0 1+ 0 2 -… +(_1) “0⑶ 
这里记為 =1, 特别地 

^[0] = 1 -* Si + & -…+ (― l) n 5 n (2)’ 

Pk = P ( C k ) 

^〜 + G :0 〜 2 - …十 (-”“ ㈡ )&⑶ 

特别地 

A = 5i - 5 2 + S 3 ——+ {-l) n ' l S n (3 )， 

证明还是用容斥法. 

首先提醒，若样本点 a; 属于 Ai,A 2 r- ,A n 中正好 m 
(1 彡 m 彡 n) 个，则 P{ cj ) 只在 S U S 2 , …， S m 中计人，而不会 
在 Sm^ijSm^r- iS n 中计入.下面进入正式证明. 

当 m = fc 时， P{ cj } 在且只在 （2) 的右边第一项 Sfc 中被计入 
一次.因此只需证明当 m # fc 时， P{u;} 在 （2) 的右边实际上未被 
计入. 

事实上，当？ n < A; 时， P{u)} 不会在 Sk，Sk+u …， S n 中计入， 
因此也就不会被计入 （2) 的右边. 

而当 m > A; 时，由于包含 a; 的 m 个事件 A ix ,A i2 , ••- , A irn 

可组成 (1 个 f 重交，故 P{o ；} 在&中被计人0次 ， Z = 
A:，A; + 1，…， m ， 因此在 （2) 的右边被计人的总次数为 

"K3( ： )-CtOG ： i)HT)G ： 2 )----Kr)0 

由于 

CT) ( 二 HDCT) 
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故 



于是证得 （2). 
由定义可知 


及 


Pk = P[k) + P[A ； + 1 ] + • * * + P[n] (4) 


Pk-^l = Pk~ P[k] (5) 


有了 （2)， 为证 （3) 可用归纳法并利用递推式 （5). 

显然巧=1 -作】即⑶ ' 成立. 

假设对巧成立 （3) 式，则利用基本组合等式 

㈡) _CT)=-CT) 

由 （5) 、 （3) 、 （2) 得 

Pk+l — Pk~ P[k) 

fc + 2 
k 

(- 1 ) 一 o 

这正是对应 fc + 1 的 P fc + 1 应成立的 （3) 式，从而完成了归纳法所 
需的证明. 

当然，读者也可以把 （2) 代人 （4) 导出 （3) 来完成本定理第二 
部分的证明. 

公式 （2) 对 fc = 0，1，2，^_ ，n 给出一个分布，更便于应用，而 
且通过 （2/ 也把一般加法公式 （3)' 作为推论. 


) Sk+3 H - 1- 


S k ^i 



Sk 七2 
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三、在匹配问题中的应用 

公式⑴的特例最早在1708年由蒙特莫特对匹配问题导出， 
有了一般公式 （1) 之后，则匹配问题成为其应用实例之一,其表达 
式见于《概率论基础》第一章§5例6,习题一 34题实质相同，习 
题一 *39 题与习题四32题亦有关联. 

《概率论基础》没有导出公式（2)，只是在习题一 *35 题中要 
求读者在匹配问题这一特例中作推导，当然这是一道有相当难度 
的习题. 


四、 在赠券收集和投球入室问题中的应用 

赠券收集问题是概率论中另外一个有趣的问题，也有实用价 
值.通常都假定每次购得第：/ (J = 1，2,…， n ) 号赠券的概率均为 

K 相当于把球等可能地投入 n 个房间之一，因此这两类问题，除 

非还有其他假定，实质上是相同的. 

赠券收集问题最关心的是要集齐全套要花多少时间或金钱，这 
显然是概率论问题，也常用一般加法公式求解. 

与上述内容关联的概率问题，《概率论基础》中均以习题的形 
式出现，计有习题一 36, *37, *38 题及习题四6题 • 

五、 对偶公式 

与一般加法公式对应的是“一般乘法公 式”： 

P { A \ A 2 - - • A n ) 

= P(Ai) - ^2 ^ ^j) + U 々 U ^4 矢） 

i l< ： i<j^n l^i<j<k^n 

一 • • • + P ( A \ U A2 U • • • U A n ) (6) 

这个公式可以用归纳法直接证明，也可以用事件的对偶公式 
利用一般加法公式来证明，还能用示性函数法证明.不过人们通常 
只记得一般加法公式（1)，它甚至被写入大部分概率论教科书，而 
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(6) 式却少为人知.大概是因为凡是关于 （6) 式的计算都可以化为 
关于一般加法公式⑴的计算.例如习题一 36题及 *38 题就是实 
例. 
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第二章条件概率与统计独立性 


» •隹 _ _ _ — i — —— 參 ■■蟲 蟲 ■_ • ■ • • — 

mm\A 


概率论研究的主要问题之一是新信息的获得将如何影响事件 
发生的概率.为此，本章定义条件概率，引进概率论的几个基本公 
式，大大增强了处理信息的 能力； 提出（统计）独立性概念，形成了 
概率论特有的研究课题.接着，从伯努利试验出发,进入学科中心， 
并引入多种分布为下章作前导. 

二项分布和泊松分布是概率论三大分布中的两个，因此设专节 
讨论.归结为二项分布计算的四个应用实例承前 启后； 对泊松过程 
的讨论则留下伏笔. 




§2.1 条件概率，全概率公式，贝叶斯公式 

条件概率在概率的三大背景场合（古典概型，几何概率，频率) 
都有直观含义，但在一般场合只能用公式定义，不过这些直观含义 
对理解条件概率还是很重要的. 

条件概率用来处理信息，扩大了概率论研究的范围和能力.乘 
法公式与加法公式是早期概率论的重要成果. 

全概率公式通过条件化把复杂问题分解成简单问题，先逐个解 
决，最后再解决整个问题.这个解题思路十分普适而合理，因而全 
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概率公式成为概率论中使用频率最高的公式. 

贝叶斯 (1702-1761) 在他死后的1763年发表的一篇论文中 
为归纳推理提出了一整套思路，其中包括如今以他名字命名的公 
式.这套理论不管对概率论还是对统计学都产生了深远的影响，本 
书只是略微涉及一点. 

关于全概率公式与贝叶斯公式的应用散见在《概率论基础》 
的正文和众多习题中，在教学札记之六“全概率公式与贝叶斯公 
式”中作了一个不很全面的小结，供参考. 

§ 2.2 事件独立性 

本节引人（统计）独立性，它是概率论中独有的概念.有人认 
为，主要是独立性让概率论从测度论的一般理论中“独立’’岀来成 
为一门学科 • 

初步的印象是独立性使许多概率计算得以简化，它的真正重 
要性将逐步显现. 

冬 独立性对条件概率的影响最为明显. 

概率论中有多种形式的独立性定义，不过其实质是一样的，最 
后都归根于事件的独立性，例如试验的独立性就是一例. 

事件独立性本身也有多种等价的定义方式，搞清事件独立性 
的涵义是重要的. 

两两独立不能推出多个也独立.这个结论要牢记,这只要记住 
伯恩斯坦的著名的反例，也许完成习题二18题能提供一些更为感 
性的认识. 

教学札记之二十三“事件的独立性与相关性”告诉大家，在学 
习过更多知识后，怎么从更宽广的背景上来看待事件独立性. 


概率计算¥式小记 


至本节,事件概率计算公式出尽，小结 如下: 



一、 加法公式 

P(A UB ) = P ( A ) + P ( B )- P ( AB ) (1) 

特例： 当 咸 S 互不相容时 

P(A + B ) = P ( A ) + P ( B ) (2) 

又称可加性. 

对立事件概率等式 

mi- p ( a ) (3) 

是可加性的特例，十分常用，尚无通用简称.本来“逆概率公式”是 
很适合的称呼，可惜这个名称历史上早已用于称呼贝叶斯公式. 
一般 形式： 

P(A X U A 2 U … U A„) P (4) ( 次木 )+ H P^AjAk) 


i i<j i<j<k 

— • _ • + P { AiA 2 - * - A n ) (4) 

方便 形式： 当 A , 也, …，人相互独立， " 

n 

P(Ai U 乂 2 U • • • U X n ) = 1 — n [1 -户⑷] ⑸ 

t=i 

二、减法公式 ^ 

P(A - B ) = P ( A )- P ( AB ) (6) 

特例： 当 4 S 时， 

P(A - B ) = P ( A )- P { B ) (7) 


减法公式之称呼尚不通用，在《概率论基础》的正文中也未出现， 
有人用来指 （7) 式. 

对立事件概率等式 （3) 也可以看作减法公式的特例. 

三、乘法公式 

P ( AB ) - P ( A ) P ( B \ A ) (8) 
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特例：当 A 与 I ?相互独立时， 

P ( AB ) = P { A ) P ( B ) (9) 

推广形式： 

P { A \ A 2 - - - A n ) = P ( Ai ) P ( A 2\ Ai ) • • - P ( A n \ A \ A 2 - - - A n -{) (10) 
一般形式： 

P{A X A 2 ^- + J2 P( < AiUA i UA ^ 

i i<j i<j<k 

— ■ • • + ( — l ) n_ U A .2 U • _ • U i 4 n ) (11) 

本式与⑷对偶，但不常用，《概率论基础》仅在习题四的1题 （4) 
中以示性函数形式给出提示. 

四、全概率公式 

P ( B ) = ^； P ( A i ) P ( B |^) (12) 

i 

是从解题中总结出来的公式，体现“饭要一口一口吃”.它与下面 
贝叶斯公式成立的条件都是 = 通常是 = a 

i i 

全概率公式的使用一般都很自然，通常不是冥思苦想的结果， 
而是立即想到的第一选择. 


五、贝叶斯公式 

P ( Ai \ B ) = 


P { A i ) P { B \ A i ) 
E 尸⑷)尸(购 

3 


(13) 


这个公式由贝叶斯作为推理公式提出，近代发展（例如在统计学与 
决策科学中）应用广泛.其重要性在概率论教本中实难充分体现. 


§2.3 伯努利试验与直线上的随机游动 

由雅科布 • 伯努利引进的重复独立试验模型是概率论发展史 
上最重要的模型，概率论的许多重要结果都在这个模型中首先发 
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现.从本节起,现代概率论的序幕被拉开. 

本节的重要论题有： 

(1) 定义了 n 重伯努利 试验； 

⑶对 n 重伯努利试验给出了概率空间（/?，多， 尸)； 

(3) 导岀伯努利，二项，几何，帕斯卡等4个重要 分布； 

(4) 给分赌注问题以完满的解答，参看教学札记之八“分赌注 
问题，，; 

(5) 引入概率论中第一个动态模型——随机游动，预示了随机 
过程的研究，参看教学札记之九“随机游动三 题”； 

(6) 解决了经典的赌徒输光 问题； 

(7) 把一维研究推广到多维，并导出多项 分布； 

(8) 为讨论随机游动的常返性作了准备 

§2.4 二项分布与泊松分布 

本节对二项分布作了仔细的研究,带有示范性,也留下许多伏 
笔.泊松分布作为二项分布的逼近登场，以泊松过程作结. 

对二项分布的讨论从计算开始.在当今，一只科学计算器便应 
付裕如的计算，在古代则是繁重的任务，为解决这类难题，许多创 
意由此产生，不少理论因它建立.通过对性质和图形的初步考察， 
相信多数读者对二项分布已有一个整体的概念， 

对二项分布的较深入讨论是结合一些应用展开的.血清试验 
中的假设检验和抽样验收中的 .( n ， C ) 方案涉及很深的统计问题，四 
大应用实例显示了二项分布在应用中的重要性，也提出了不可回 
避的计算问题,将导致富有成果的研究. 

历史上，泊松分布正是作为小概率 p 下二项分布的近似计算 
公式引入的，谁能料到现在它在概率论中的地位远在二项分布之 
上.这里给出的泊松定理及证明大体保持历史原貌. 

泊松分布的特质只有通过?白松过程才能 显现. 《概率论基础》 
把原属随机过程的内容写入基础概率论有点大胆,但效果不错，原 
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因之一是利用了辛钦对呼叫流的精细的分析研究成果（见参考书 
目[8])，使用柯西方程也有微功.关于后者见教学札记之十一 “柯西 
方程与分布刻画”. • 

特别指出，研究动态随机现象（随机过程）是当代概率论的主 
题,本章中有两个 例证： 离散时间的随机游动与连续时间的泊松过 
程.《概率论基础》都用初等方法作了处理. 

对随机游动，一维无限制场合，给出时刻 n 处于状态 A : 的概 
率.二维对称场合，给出经 2 n 步返回原点的概率.有吸收壁场合， 
则利用全概率公式导出吸收概率所满足的差分方程，用递推法得 
出答案.进一步信息参看教学札记之九“随机游动三题”. 

在泊松过程，利用全概率公式导出状态概率 P k ( t ) 所满足的常 
微分方程，经求解得出答案——泊松分布. 

上述二者预示着有很多模型和大量结果可类似建立与导出. 

y 匀盔觫¥与评注~~ 1 

1. 把字母 S 、 T 、 A 、 T 、 I 、 S 、 T 、 I 、 C 、 S 分别写在一张卡片 
上，充分混合后重新排列，问正好得到顺序 STATISTICS 的概率是 
多少？ 

提示： 用推广的乘法公式. 

^ 3 3 1 2 2 2 1 1 1 

109 , 8 , 7 * 6 * 5 ' 4 ' 3 , 2 ， 

【评注】这类问题用推广的乘法公式立即写出答案，也可利用 
概率的古典定义和重复排列计算. 

2•若 M 件产品中包含 m 件废品，今在其中任取两件 ，求: 
(1) 取出的两件中至少有一件是废品的 概率； （2) 已知取出的两件 
中有一件是废品的条件下，另一件也是废品的条件 概率； （3) 已知 
两件中有一件不是废品的条件下，另一件是废品的条件概率. 

解 （1) 设{取出的两件中至少有一件是废品 L 
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尸⑷ 


Cr)(K) 
^ (?) 


m(2M 一 m — 1) 
~ M(M - 1) ~ 


(2) 设 A ={ 取出的两件中至少有一件是废品}，再设 B ={ 取出 
的两件都是废品1，可见 B C 為且有 


P { B ) 


S 


所求概率为 


P ( B \ A ) 


P { AB ) _ P ( B ) 

~p(^ = nA) 

771 — 1 

2M — m — 1 


© 


(t)( m D+(t) 


(3) 设 C ={ 取出的两件中有一件不是废品}， D ={ 取出的两件 
中恰有一件废品丨，则所求的概率为 



2 m 

M + m — 1 


【评注】古典概型中条件概率直接计算 一例. 

3. 甲袋中有 a 只白球，6只黑球，乙袋中有 a 只白球，/3只黑 
球，某人从甲袋中任取两球投人乙袋，然后在乙袋中任取两球，问 
最后取出的两球全为白球的概率是多少？ 

提示：用全概率公式. 


• 73 . 




[ 评注】全概率公式应用之典型例一， 
4. 设一个家庭中有 n 个小孩的概率为 




n ^ 1 
n = 0 


这里0 < p < 1，0 < a < 若认为生一个小孩为男孩或女 

P 

孩是等可能的，求证一个家庭有 k ( k ^ l ) 个男孩的概率为 2 ap k / 
(2 一 

证设 An= {一个家庭中有^个孩子 }， n = 1，2,…， 
该家庭中有 fc 个男孩1 ， k ^ 1 ,由于假定生男孩或生女孩 

是等可能的，所以有 P ( B k \ A n ) = Q ( i )", 由全概率公式得 
P ( B k ) = P ( A n ) P ( B k \ A n ) = f ； ap n (~) n 



oo 


E 


CD© fc+i 


u oo 

i=0 


cr )© 1 



2 ap k 

(2 - p )^ 1 


【评注】全概率公式应用之典型 例二. 

5. 在上题假定下： （1) 已知家庭中至少有一个男孩，求此家庭 
至少有两个男孩的 概率； （2) 已知家庭中没有女孩，求正好有一个 
男孩的概率. 
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解 （1) 设 A ={ 家庭中至少有一个男孩}， s ={ 家庭中至少有 
两个男孩则有 sc A 且 

P(A) = V - 2 q 〆 = • p /( 2 一 P ) 

^ 2 -P l - P /(2- p ) 

ap 

~ (2-p)(l - p) 

p(B) = y 2ap \- = ^sl . IIP^— 

(2-p) fc+1 2-p l-p/(2-p) 


P(B\A )= 


(2 - p) 2 (l - p) 

P(AB) P(B) 
~ p { Ay ^ p { A ) 


p 

~v 


( 2 ) 设 C ={ 家庭中无女孩 }={ 家庭中无孩子，或家庭中有 n 个 
孩子且都是男孩1，又设0 1= ^家庭中正好有一个男孩家庭中 
只有一个孩子且是个男孩则 C C ， 且 


P(C) = 1 - 


ap 


P 


+ 




n- 


1 ap + otp(2 i ap ^ ap 

1 一 p 1—p/2 1—p 2 — ; p 

2 - 3p — ap + p 2 

(l-p)(2-p) ^ x 

p i D i) = ap • - = -ap 


所求概率为 

P(Dl|C ) = nD ^ C ) = P ( A ) = ag t q -£)(2 二 P) _ 

^ 11 ； P{C) P{C) 2 2-3^-ap + p 2 

= ap(l-p)(2-p) 

2(2 一 3p — ap + p 2 ) 

【评注】以上两题给出一个人口生育的概率模型，并用以训练 
全概率公式与条件概率的计算. 
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6. 已知产品中96%是合格的，现有一种简化的检查方法，它把 
真正的合格品确认为合格品的概率为0.98,而误认废品为合格品 
的概率为0.05,求以简化法检査下为合格品的一个产品确实是合 
格品的概率. 

提示：用贝叶斯公式. 

答 0.997 9. 

【评注】贝叶斯公式最简应用举例. 

7. 炮战中，在距目标250米，200米，150米处射击的概率分 
别为0.1，0.7, 0.2,而在各该处射击时命中目标的概率分別为 0.05, 
0.1，0.2,现在已知目标被击毁，求击毁目标的炮弹是由距目标250 
米处射出的概率. 

提示：用贝叶斯公式. 

答由贝叶斯公式可得所求概率为 0.043 5. 

【评注】贝叶斯公式一般应用举例. 

8. 飞机坠落在 A ， B ， C 三个区域之一，营救部门判断其概率 
分别为0.7, 0.2, 0.1; 用直升机搜索这些区域，若有残骸，被发现的 
概率分别为0.3, 0.4, 0.5, 若已用直升机搜索过 A 区域及 B 区域， 
没有发现残骸，在这种情况下，试计算飞机坠落在 C 区域的概率. 

解 设飞机坠落在 A 区域 >， S = 丨飞机坠落在 B 区域}， 
C ={ 飞机坠落在 C 区域}，已搜索过 A ， B 区域，没有发现残 
骸>，则 


P ( S ) = P { A ) P { S \ A ) + P ( B ) P { S \ B ) + P { C ) P ( S \ C ) 


所求概率为 


0.7 x 0.7+ 0.2 x 0.6+ 0.1 = 0.71 


P ( C \ S ) = = = 0.14 


P ( S ) 0.71 
【评注】把最新信息植入贝叶斯公式，计算有关概率，以助决 


策. 
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9. 选择题有 4 个答案，只有一个是正确的.不懂的学生从中 
随机选择.假定一个学生懂与不懂的概率都是1/2,求答对的学生 
对该题确实懂的概率. 

提示：用贝叶斯公式. 

答 0 . 8 . 

【评注】为选择题提供理论依据. 

10. 甲袋中有3只黑球，7只 白球； 乙袋中有7只黑球，13只 
白球; 丙袋中有12只黑球，8只白球.先以1 : 2 : 2的概率选择甲、 
乙、丙中的一只袋子,再从选中的袋子中先后摸出 2 球，求 •. （1) 先 
摸到的是黑球的 概率； （2) 已知后摸到的是白球，求先摸到的是黑 
球的概率. 

解 （1) 设 A 、 A 2 、 A 3 分别为选到甲袋、乙袋、丙袋的事件， 
氏 先摸到的是黑球>，则 

P ( Sx ) - PiA ^ PiBM ^ + P ( A 2 ) P ( B 1 \ A 2 ) + P ( A 3 ) P ( B l \ A 3 ) 


1 3 2 7 2 12 ^ 

一 * -一 - - h 一* — = 0.44 

5 10 5 20 5 20 


(2) 设否 2 ={后摸到的是白球}，则 
p ( b 2 ) = P ( A l ) P ( B 2 \ A 1 ) + P ( A 2 ) P ( B 2 \ A 2 ) + P ( A 3 ) P ( B 2 \ A 3 ) 


1 7 2 13 2 8 … 

—— * + — • — - f - 一 . — — 0.56 

5 10 5 20 5 20 

这个答案也可由 （1) 利用对称性直接得到. 

戶(历否 2 ) = P { A l ) P { B l B 2 \ A l ) P ( A 2 ) P ( B l B 2 \ A 2 ) 

+ P ( A 3 ) P ( B 1 B 2 \ A 3 ) 


1 

5 


所以所求概率为 


3 7 2 
10 9 5 


7 13 2 12 8 

■ 

20 19 5 20 19 


0.243 51 


P { Bi \ B 2 ) 


P ( jBiS 2 ) 0.243 51 


P ( B 2 ) 0.56 

【评注】全概率公式与条件概率综合应用举例. 


0.434 8 
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11 . 甲、乙两人轮流射击，先击中目标者获胜,设甲、乙击中目 
标的概率分别为 Pl 及 P2 , 甲先射，试求甲获胜的概率. 

提示： 仔细分析，从甲获胜这一事件入手. 

答 Pi 

A Pi + P2 - PlP2* 

【评注】独立性假定下的概率计算，从事件分析中找出规律. 

12 . 飞机有三个不同的部分遭到射击，在第一部分被击中一弹 
或第二部分被击中两弹，或第三部分被击中三弹时，飞机才能被击 
落,其命中率与每一部分的面积成正比，设三个部分的面积的百分 
比为0.1，0.2, 0.7. 若已击中两弹，求击落飞机的概率. 

提示： 分析两弹击中何处，可击落飞机. 

答 0.23. 

【评注】还是从事件分析入手 ■ 

在初等概率论中，事件分析和概率计算是训练的永恒主题. 

13. 证明： 对于事件 A ， S ， 关系式 

P 2 ( AB ) + P 2 ( AB ) + P 2 ( AB ) + P 2 ( AB ) = J 
成立的充要条件为 

P { A ) = P { B ) = 1 - , P { AB ) = i 
证柯西不等式 

i=l i=l i=l 

等号成立的充分必要条件是 

ai a 2 a n 

■ — 

&1 62 b n 

由此立得 

q 2 + 6 2 +c 2 + rf 2 = 

4 
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的充分必要条件是 


a = b 二 c = d 


进而若有 


则 

的充要条件是 

本题中 


a+6+c+d= 1 

a 2 + 6 2 + c 2 + d 2 = 7 

4 

a = b = c = d = - 

4 


P ( AB ) + P ( AB ) + P ( AB ) + P ( AB ) 


= P({A + A ) B ) + P{{A + A ) B ) 

= P { B ) + P ( B ) = 1 

故由 

P 2 ( AB ) + P 2 ( AB ) + P 2 ( i 4 B ) + P 2 ( AB ) = ^ 

推知 

P ( AB ) = P ( AB ) = 尸⑽) = P(A B ) = J 

于是可得 

P (>4) = P ( AS ) + P { AB ) = ^ 

Zi 

P ( B ) = P { AB ) + P ( AJB ) - \ 

id 

反之，由 

P ( A ) = P ( B ) = •及 P ( AB ) = ^ 

可推得 

P ( AB ) = P { B )- P ( AB ) = i 
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P(AB) = P ⑷一 P(AB )= - 


P(AB) = 1 - P(AB) - P(AB) - P{AB) = ^ 

所以可得 

P 2 (AB) + P 2 (AB) + P 2 (AB) + P 2 (AB)=^^ 


【评注】从论证中可以看出恒成立不等式 

P 2 {AB) + P 2 {AB) + P 2 {AB) + P 2 (AB) ^ i 
而本题给出等号成立的充要条件.这与习题一 45 题构成有趣的对 


照. 

14. 若 A 与 S 独立，证明 {0, A , A , Q } 中任何一个事件与 
{ 0 , B , B , Q } 中任何一个事件是相互独立的- 
提示： 验证 16 个等式. 


证证明留给读者. 

【评注】题意是，事件 A 与事件 B 相互独立等价于由它们分 
别产生的 a 域即 (7(4) 与 a { B ) 相互独立. 

15.若0 < P { B ) < X ,试证： 

(1) P ( A \ B ) = P ( A \ B ) ] 

(2) P { A \ B ) + P ( A \ B)^l 
均为 A 与 B 相互独立的充要条件 • 

证 （1) 若 A ， B 相互独立，则為否也相互独立，于是 


P(A | B ) = 


P(AB) 

P { B ) 


P(A)P(B) 

P(B) 




P(A I B )= 


P{AB) 

'WT 


P(A)P(B) 

P(B) 



所以 


P(A\B) = P{A\B) 



反之，若 P ⑷ S ) = P ⑷司，则 

P{AB) P{AB) P(A) _ P(AB) 

P(B) = P(B) ^ ~1 - P{B )~ 

P(AB) - P(B)P(AB) = P(A)P(B) - P(B)P(AB) 

所以 

P(AB) = P(A)P(B) 

故 A S 相互 独立； 

(2) 若洚 S 相互独立，则 

P{A\B) + P(A\B) = P{A) + P(A) = 1 

反之， 

P{A IB) = 1 - P(A I B) = P{A I B) 

由⑴得木 S 相互独立. 

【评注】事件独立性有许多等价定义. 

16. (费勒）抽査一个家庭，考察两个事件， A 至多有一个 女孩; 
B: 男女孩子都有.假设男女的出生率都是1/2,试 证：对 3个孩子 
之家，乂与 B 独立； 而对4个孩子之家，4与 S 不独立. 

证 对3个孩子 之家： 

P ( A )- 至多有1个女孩 } 

= P{3 个男孩 } + P { 1个女孩和2个男孩 } 

尸( 5 )=户{男女孩字都有 } 

= P {1 个女孩和2个男孩 } + P {2 个女孩和1个男孩 } 

3 3 3 

= 8 + 8 = 4 

P(AB) = P{ 1个女孩和2个男孩 } = 3 x 士 = ■ 

o o 

易得 P(AB) = P(A)P(B), 所以 A，B 独立 • 
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对 4 个孩子 之家： 

P(A) = P{4 个男孩 } + />{ 1 个女孩和 3 个男孩 } 

_ 1 丄 j 1 _ 5 

=—+ 4 x ^ ~— 

16 16 16 

P(B) = /^1 个女孩和 3 个男孩 } + 个女孩和 2 个男孩 } 

十 P{ 3 个女孩和 1 个男孩 } 

7 


4 6 4 

16 + 16 + 16 = 8 


P(AB) = P{ 1 个女孩和 3 个男孩 } 




16 


可见 P{AB) ^ P(A)P(B), 故 A S 不相互独立- 

【评注】独立性在理论研究中应按定义验证，但在应用中常用 
直观判断，本题说明直观并不一定可靠. 

有人说,统计独立性并不是纯数学概念，概率论中用 P(AB) = 
P(A)P{B) 规范了它，使之纳入体系而能处理 ： 这说法颇为深刻. 

17. 事件 A ， S ， C 7 两两独立， ABC = 0, P{A) = P{B) = P{C\ 

且已知 P(AUBUC) = 试求 p ( A )^ 

lb 

提示：用一般加法公式. 

答！ 

° 4 - 

【评注】在第一章的计算题中加入独立性. 

18. 设八汉 C 三事件相互独立，求 证：⑴ AUB, AB.A^B 
皆与 C 独立; ⑵ A 瓦 U 亦相互独立. 

证⑴ P((AU B)C) = P(ACU BC) 

= P(AC) + P(BC) - P(ABC) 

= P(A)P(CyhP(B)P(C)-P(A)P(B)P(C) 
=[P(A) + P(B)- P(AB)] P(C) 

= P(AU B)P(C) 
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所以 AUZ? 与 C7 独立 . 

P (( AB ) C ) = P ( ABC ) = P ( A ) P { B ) P { C ) = P { AB ) P ( C ) 

所以 AS 与 C 独立 . 

P (( A - B ) C ) = P ( AC - BC ) 

= P ( AC ) - P ( ABC ) 

= P ( A ) P ( C ) - P ( AB ) P ( C ) 

- [ P ( A )^ P ( AB )] P ( C ) 

= P ( A - B ) P { C ) 

所以 A - S 与 C 独立 . 

(2) P ( AB ) = 1- P ( A \ JB ) 

=1 -尸⑷- P ( B ) + P ( AB ) 

=1 一 P ( A )~ P ( B ) + P ( A ) P ( B ) 

=[1 - P ( A )] [1 - P ( B )] 

= P ( A ) P ( B ) 

类似可得 

P ( BC ) - P ( B ) P ( C ) , P ( CA ) = P ( C ) P ( A ) 

又 

P ( ABC ) - 1 - P(A UBUC ) 

=1 一 P { A )- P(B)- P ( C ) + P ( AB ) 

+ P { BC ) + P { CA ) - P ( ABC ) 

=1 一 P ( A )- P ( B )- P ( C ) + P { A ) P ( B ) 

+ P ( B ) P ( C ) + P ( C ) P { A ) - P ( A ) P ( B ) P { C ) 
=[1 - P ㈤ ] [1 - 寧)] [1 - P ( C )] 

= P ( A ) P ( B ) P ( C ) 
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所以 I， 瓦 U 相互独立. 

【评注】两事件独立场合《概率论基础》第二章§2推论1 
及推论2之类结论在三事件独立场合的 推广. 在证明中可以看出 
《概率论基础》第二章§2定义 2 . 2.2 中四个等式同时成立的必要 
性. 


注意即使假定 A 与 C , B 与 C 独立，甚至假定 A 5, C 两两 
独立，仍然推不出 4 US 与 C 独立；另一方面，若 A 与 B 与 C 
独立，又 A 与 B 不相容，则4 B 与 C 独立.对4 一 B 与 C 的 
独立，两两独立性也不够，除非 ADB . 这两者都来源于与 C 
独立，要求 P { ABC ) = P { AB ) P ( C ), 这时需有《概率论基础》中 
(2.2.4) 型的等式成立. 

不难通过伯恩斯坦反例来加以佐证.事实上在该例中 
P{AUB} = ^, P{AB} = ^, P{A ~B}=^ P(C) = ^ 

P{(AuJ3)C}-i P{(AB)C} = \ ) P{(A-B)C}=0 

在 A B ， C 两两独立下，本题结论并不成立. 

*19. 证明： 事件^戌，…，4相互独立的充要条件是下列 2" 
个等式 成立： 


P(U 2 = P(A 1 )P(A 2 )^- P(A n ) 

其中承取次或忑. 

证必要性：因为事件交的运算和数的乘法运算都满足交换 
律，所以不妨设 ii， …，人中前 m 个为 A， 后 n - m 个为4的 
形式. 

当 m = 0,成立 

PiA^ •••<) = P(A 1 )P(A 2 ) P(A n ) 

当 m = 1, 

P(A\A2 - - - A n ) = P(A2 * - - A n ) — P{A\A2 - - - A n ) 
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= P(A 2 )... P(A n ) - P(A l )P(A 2 ) - . - P(A n ) 

=P(A l )P(A 2 ) • - P(A n ) 

设 m = A : 时有 

P(Ai --A n ) — P{Ai) - - - P{Ak)P{Ak^-\) - - - P{A n ) 

则当 m = A ; + 1 时 

P{M … 4+ i > U +2 … Ai ) 

= P{A\ - - - AicAfc+a • • • An) — jP(A\ … A ； c+2 • • • An) 

=P(i4l) - • • P(Ak)P(Ak^2) • • • 尸 ( 乂 n) 

一 P(A k )P(A k ^)P(A k ^ 2 )-- P{A n ) 

=P(Ai)--*P(i4fc)(l - P(A fe+ i))P(Afc + 2) - ■ -P(A n ) 

= 尸 ㈤… P{A k )P(A k+1 )P(A k ^)-- P(A n ) 

从而有欲证的 2" 个等式 成立： 

P(AiA 2 • • ■ 上） = P(ii)P(i 2 ) ••- P(A n ) 

充分性：直接可得 

P(A 1 A 2 … 求） = P(A 1 )P(A 2 )-- P(A n ) 

对 n - 1个事件的交，有 

P{A\ - - - Ai^iAi^i - - - A n ) 

= P{A\ • • - Ai^\AiAi-\-\ - • * A n ) 4 - P{A\ - - - Ai 一 iAiA+i • • • A n ) 

=P ( 皋） … P(^-i)P(^i)F(^ +1 )*-. P(A n ) 

+ P(A X )-- P(^_ 1 )P(A i )P(A i+ i)... P(A n ) 

= P ( i 4 l ) - * - P ( Ai ^ i ) P ( Ai ^. l ) - - - P (- An ) 

由归纳推理可知独立性定义要求的 2-- TI -1 个等式均可成 
立，所以 i 4 i , >^2,…，相互独立* 
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【评注】考虑用这 2 n 个等式作为 A u A 2r - 相互独立定 
义的优点与缺点. 

20. 三个工作小组独立对某个密码进行破译，如果他们成功的 
概率分别为 0.4, 0.5, 0.7, 试求该密码被成功破译的概率. 

提示：用 《概率论基础》公式 (2.2.6). 

答 0.91. 

【评注】事件并的概率计算在独立场合不再困难. 

21 •设 A u A 2r ^ y A n 相互独立，而 P ( A k )= p k , 试求 ：⑴所 
有事件全不发生的 概率； （2) 诸事件中至少发生其一的 概率； （3) 恰 
好发生其一的概率. 

提示： 上题做法的公式化与推广 

k=i 

( 2 ) l - fl ( l - Pk ); 

J-l 

【评注】相互独立假定下的典型计算题. 

22. 当元件 K 或者元件及欠 2 都发生故障时电路断开，元 
件 K 发生故障的概率等于 0.3, 而元件欠 2 发生故障的概率各 
为 0 . 2 , 求电路断开的概率. 

提示： 画出简图，分清并联或串联线路，各选适用算式，再综 
合而成. 

答 0.328. 

【评注】在这类常见的计算题中，只选最简单的一个，是希望 
学生能举一反三. 

23. 说明“重复独立试验中，小概率事件必然发生”的确切意 
思. 

答以记事件 I 小概率事件 >4在重复独立试验的第 fc 次 
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出现}，其发生的概率记为 P ( A k ) = e ,0< e < l . 由21题之 （2), 
在 n 次独立试验中，4至少发生一次的概率为1 - (1 - _ 

l(n - oo ), 这说明当独立试验次数无限增加时，即使是小概率事 
件，它至少发生一次的概率无限接近于1，从而可以认为它是必然 
会发生的. 

【评注】为经常乱穿马路，爱在不洁小摊进食者戒. 

24.甲、乙、丙三人进行某项比赛，若三人胜每局的概率相等， 
比赛规定先胜三局者为整场比赛的优胜者，若甲胜了第一、三局， 
乙胜了第二局，问丙成为整场比赛优胜者的概率是多少？ 

提示： 仔细分析事件，小心计算概率. 


【评注】解题关键仍在于对事件进行细致分析. 


25. 设实验室器皿中产生甲类细菌与乙类细菌的机会是相同 
的，若某次发现产生了 2 n 个细菌，求 （1) 至少有一个甲类细菌的 
概率； （2) 甲、乙两类细菌各占其半的概率. 


提示：产生的甲类细菌的个数可视作二项分布. 





2n 


【评注】进入伯努利概型，二项分布. 


26. 掷硬币出现正面的概率为 p , 掷了 n 次,求下列概率彳 1) 至 
少岀现一次 正面； （2) 至少出现两次正面. 

提示： 用二项分布. 


答 (1) 1 一 (1 - p) 、 (2) 1 一 （1 - p 广一 np(l - P )^\ 

【评注】 P ( A ) = 1 - P ( A ) 应用之一例 • 

27.甲、乙均有 n 个硬币，全部掷完后分别计算掷岀的正面数， 
试求两人掷出的正面数相等的概率. 


提示： 二人掷出的正面数都服从二项分布且独立. 
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解利用二项分布，得 




2n 


【评注】这也是对称随机游动，经 2 n 步返回原点的 概率. 

28. 在伯努利试验中，事件 A 出现的概率为 p ， 求在 n 次独立 
试验中事件4出现奇数次的概率. 

解事件4出现偶数次的概率记为 ci ， 出现奇数次的概率记 
为&，则 


a = 0(1 - P) n + O % 1 - P) n_2 + ... 

b= (?)p(l -P) n_1 + Qp 3 (l - p ) n_3 + … 


则有 a + 6=( p+l — p) n = 1, a - 6 = (1 —p — p ) n ，于是得到事件 
A 出现奇数次的概率为 • - |(1 - 2 p ) n . 

【评注】正确写出&的表达式即算答对，但应当想到可以化简， 
从而达到最终的简明答案. 

*29. 在伯努利试验中，若4出现的概率为 p ， 试证在出现 m 次 
A 之前出现 n 次4的概率，即分赌注问题中甲最终取胜的概率，可 
由 （2.3.13), (2.3.14)， (2.3.15) 中的任一式子表出，即它们是相等的 • 

证由帕斯卡分布得 



(2.3.13) 
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或 


OO / . . v 

n frn + k — l\ ju ^ 

P ^ = Z2[ k )PQ (2.3.14) 

fc=n \ / 

利用二项分布得 

n+m - 1 y 、 

P3= S jp k q n+rn ^ k (2.3.15) 

/C-—Tl 

其中 g = 1 — p . 

(1) 先证 P 3 = /\ ，即 


n+m—1 

E 



/n + m — l 

V k 



+m—l — fc 



当 m = 1，得 p n = p n ， 等式成立； 

当 m = 2， 

左边 =( n r ) p 〜 +o +i= ，一 +1) 
右边 =( n Q X ) pn+ ( i ) pn? = P n ( ! + n Q ) 


等式也 成立; 


假设当 m = r 时， 

n i： _1 ( n+ r > 『一 *=£ d - r ) P v 


k—n 


则当 m = r + l 时， 

n+r 


E 

k=n 


n + r 
k 


\p k q 


n+r—fc 


k =0 


k 


n+r- 


E 

fc=n 


n + r 
k 


\p k Q n 


-左 ， (n + r , 

n + r ]P 



an 



由熟知的等式 


f n + r\ 
、 k ) 


Vi + r — 1 
k 


Vi + r — 1 、 

fc — 1 


n+r— 1 


9 e r + r 1 w 

k=n 


k 


-初二 1 ， 

k=n \ 


( n + r — T 
n + r~l) P 

n ^Vn+r-r 

q 2 ：{k 

k=n \ 

r £ -1 0 +r_i 

k—n ^ / 


)P k Q 


n+r / 

r n _ l _ r _ l_ fc + y ^ I n + r ' 

k ~ 

n+r / I 

fc +E tr 

fc=n+l \ 


/n + r - 1\ n r 
+， n -1 )PV 


第 2 项中令 j = fc-l 

n+r—1 


k 


9 e r+r Vf 一 

k=n 

n+r —丄 / . !' 

+p E ( n+ 阶― 

j=n \ 3 

+o 

ro ，一 +CT- 1 ’ 


⑷ 


.一 i 


g(Hv+( n + r r _V ， 

fc — o 


E 

k=0 


Vi + fc — r 
k 


p . 




故由归纳推理得 P 3 = iV 


p k q n ^ k 

p k q n+r-k 

\ p k q n ^ r - k 


p n Q r 





于是有三式彼此相等. 

【评注】总算写完如此繁复的 论证. 顺便指出亦可利用 ~ = 

dg 

证明巧= Pi . 

30. 袋中有 10 只黑球 ， 10 只白球，从中将球一只只摸出，求在 
第 9 次摸球时摸得第 3 只黑球的概率. 

提示：事件 分析： 必须且只需前8次得2黑且第9次摸得黑 


球. 
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【评注】请与帕斯卡分布的推导及结论对照. 

31. 设有 iV 个袋子，每个袋子中装有 a 只黑球，6只白球，从 
第一袋中取出一球放入第二袋中，然后从第二袋中取出一球放人 
第三袋中，如此下去，问从最后一个袋中取出一球而为黑球的概率 
是多少？ 

解设 山 从第 1 袋中取出一球是黑球丨，则 


P(Ai ) = 


a 

a + b 


P(Ai )= 


a b 


设 A 2 ={bkm 1 袋中取出一球放入第 2 袋中，再从第2袋中 
取出一球是黑球}，则 


P { M ) = 


a 

a b 


ci + 1 
a + b+1 


b 

a + b 


a 一 a 
a + 6+1 cl b 


P(J 2 ) = 士 

d ~h 0 

一般设[按上述规则取球放球，并在第 fc 袋中取出一球是 
黑球}，且 P ( A k ) = 则 

P ( A k+l ) = P ( A k ) P ( A k ^\ A k ) + P ( A k ) P ( A k ^\ A k ) = 


由数学归纳法得 


P ( A ^) — 


a 

a b 


【评注】开始进入全概率公式-差分方程题型. 

32. 甲袋中有 N -1 只白球和1只黑球，乙袋中有 iV 只白球, 
每次从甲、乙两袋中分别取出一只球并交换放入另一袋中去.这样 
经过了 n 次，问黑球岀现在甲袋中的概率是多少，并讨论 n — oo 
时的情况. 
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解设经 n 次交换后，黑球在甲袋中丨，则经 n 
次交换后，黑球在乙袋中 } ，记〜= P(A n ), q n == P(A n ) = 1 - p n , 
由全概率公式 

pn = P(A n ^i)P(A n I A n ^i) + P(An^i)P{A n I A n ^i) 


Pn 


AT — 1 


N 

1 


N 


- 1 N 

一 1 

N Pn - 

1 + 

1 

N 

一 N + 

1 

N — 2 、 

(1 

N ' 

、N 

1 N — 

2 

N N 


、 （ N- 

-2 、 

L \ N . 


2 \ 


+ 9 n - 


N 


N 


■ Pn-l (n ^ 1), 初始条件 Pq = 1, 故 


+ 


N 


Pn -2 


+ ••• + 7 


/N — 2\ n ~ 1 /N — 2\ n 
(N ) + ( N ) 


n/(: 


N\ N 
AT — 2 


N 

N - 2\ n 


N 


)+ ( ㈤ 


2 2V JV 


当 且 72 — oo 时， lim p n = 士. 

n—»oo 2 

【评 注】 ①应导出下面的递推公式，以后可弓 I 用. 
即对差分方程 Pn = ap n _i + 6, 其解为 


Pn = a n 




(a 一 1) 


② 若用 28 题结果可得另一解法. 

③ 亦可用全概率公式_差分方程法求解 28 题. 

•33. 投硬币 n 回，第一回出正面的概率为 c , 第二回后每次出 
现与前一次相同表面的概率为 P ， 求第 n 回时出正面的概率，并讨 
论 n — oo 时的情况. 

解设人={第71回时出正面}，并记 Pn = P (人)，由全概率 
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公式 


Pn = P{A ri ^i)P(An I A n -i) 4 - P(A n -i)P(A n I i4 n -i) 
=Pn - 1 P+ (1 - Pn-l) (1 ~P) 


=(1 - p ) + (2 p — l ) p n -l 


得差分方程 Pn = (2 p - l ) p n -i + (1 - p ), 初始条件 Pi 


P 


—(2p—1) 一 2 


，由 32 题评注①得 
= (2 p - l ) n_1 ( c - i ) + ^ 3 p^l 


当 0<p<l, n—►oc 时， lim p n = 士 . 

n—>oo 2 

【评注】可讨论 p = 0,p=l,c=^ 等特殊场合，加深 理解. 

*34. 甲、乙两袋各装一只白球一只黑球，从两袋中各取出一球 
相交换放入另一袋中，这样进行了若干次.以化， g n , r n 分别记在 
第 n 次交换后甲袋中将包含两只白球、一只白球一只黑球、两只 
黑球的概率.试导出 Pn - fl , 9 n + l ， 用 Pn ，9 n ， 〜表出的关系式， 
利用它们求 Pn +1, 9 n - hl > 的表达式，并讨论当 n — 0 C 时的情 
况. 


解由全概率公式 

^ 1 ^ 1 
Pn+1 = 0 * Pn ~l~T9n + 0 , r n = — q n 

4 4 


9 n+l = 1 * Pn + 2 + 


n = Pn + 2 ^ + r n 


r n+ i=0-p n + i9n + 0T n = ign 


另有等式 Pn + = 1, 从而推得 


9 n+l = 1 — 
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初始条件 po = r o = 0, go = 1，由32题评注①可得解 

一昼卜(-『] 

并推得 

1 

p 种 1 〜 1 、 

当 n — oo 时， 

lim Pn+i = lim r n+ i = lim ? n -fi = i 

n—^cx) n—»oo O n—*oo o 

【评注】这是统计物理学颇为重要的一个模型. 

35. —个工厂出产的产品中废品率为0.005,任意取来1 000 
件,试计算下面概 率：⑴ 其中至少有2件 废品； ⑺其中不超过5 
件 废品； （3) 能以90%的概率希望废品件数不超过多少？ 

提示：用伯努利概型，利用泊松逼近. 

答 （1) 0.959 572; (2) 0.615 960; (3) 8. 

【评注】二项分布用泊松逼近计算. 

36. 试给出泊松试验的严格表述. 

解泊松试验指如下试验 序列： 

Sn 


五21， 

五22 


五31， 

五32， 

E33 

五 nl ， 

五 n 2， 

E n 3y …， E n 


同一序列的诸试验相互独立，且每一试验中事件4出现的概 
率等于 Pn ， 只与序列编号 n 有关. 

泊松试验中，若 np n ― ► A , 则第 n 号序列中事件4的出现次 
数渐近服从泊松分布. 








【评注】泊松试验是很不同于伯努利试验的另一个概率模型， 
它大大拓展了概率论的研究领域.《概率论基础》中关于电话呼叫 
流的讨论提供了它的一个一维模型，而在参考书目 [8] 《概率论与 
数理统计简明教程》 p .46-48 中则提供了它的一个二维模型，可以 
参看. 

37. 某厂长有 7 个顾问，假定每个顾问贡献正确意见的百分比 
为0.6,现为某事可行与否而个别征求各顾问意见，并按多数人的 
意见作出决策，求作出正确决策的概率. 

提示： 假定独立性，用二项分布. 

答 0.710 2. 

【评注】二项分布的直接 计算. 

38. —本 500 页的书，共有 500 个错字，每个字等可能地出现 
在每一页上，试求在给定的一页上至少有 3 个错字的概率. 

提不： 用泊松分布. 

答 0.080 302. 

【评注】泊松分布计算的实例之一. 

39. 某商店中出售某种商品，据历史记录分析，每月销售量服 
从泊松分布，参数为 7, 问在月初进货时要库存多少件此种商品，才 
能以 0.999 的概率充分满足顾客的需要. 

提示： 反查泊松分布表. 

答 16， 

【评注】泊松分布计算的实例之二. 

40. 螺丝钉生产中废品率为 0.015, 问一盒应装多少只才能保 
证每盒中至少有 100 只好螺丝钉的概率不小于 80% (提 示： 用泊松 
逼近，设应装 100 + fc 只) • 

提示： 按原题提示 ， A = (100 + fc ) x a 015 s 1.5. 

答 102. 

【评注】无此提示几乎不知从何下手，以后应 牢记. 

41. 某疫苗中所含细菌数服从泊松分布，每 1 毫升中平均含 


. QR . 



有一个细菌，把这种疫苗放入5只试管中，每试管放2 mL ， 试求: 
(1)5 只试管中都有细菌的概率； （2) 至少有3只试管中有细菌的概 
率. 

提示： 每只试管的细菌数服从 A = 2 的泊松分布，各试管间的 
细菌数独立. 

答 （1) 0.483 3; (2) 0.98. 

【评注】泊松分布结合二项 分布. 

42. 实验室器皿中产生甲、乙两类细菌的机会是相等的，且产 
生 fc 个细菌的概率为 

\k 

Pk = 一入，友 = 0 ， 1 ， 2, … 

试求： （1) 产生了甲类细菌但没有乙类细菌的 概率; （2) 在已知产生 
了细菌而且没有甲类细菌的条件下，有2个乙类细菌的概率. 

解 （1) 产生了 A : 个细菌且 A : 个细菌全是甲类细菌的概率为 

答 e — A G ) '所以所求概率为 


E 


k - 


x k 

~k\ 




( 2 )产生了细菌但没有甲类细菌的概率与 （1) 中的概率相同， 
产生2个乙类细菌的概率为 ^ e - A ( i ) 2 , 故所求的条件概率为 


A 2 

2T 6 


-A 



A 2 

8(3 — 1 ) 


【评注】结合了本章所讲的许多概念. 

43. 若每条蚕的产卵数服从泊松分布，参数为 A ， 而每个卵变 
为成虫的概率为 P ， 且各卵是否变为成虫彼此独立，求每蚕养活 A ; 
只小蚕的概率. 

解以人记蚕产出 n 个卵，以风记每条蚕养活 fc 只小蚕， 
依独立性假定，若蚕产出 n 个卵，则这 n 个卵中成活的成虫数服从 
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二项分布，于是所求概率为 

P(B k ) = f ； P(A n )P(B k \A n ) = E~e~^Mp k (l-p) n ~ k 


p fc e -入 

fc! 


二 \k^j 

EVu-p 尸 

j=0 




= Ap 

【评注】这是复合泊松分布的特例，有多种变体，以后还要讨 
论. 

44. 通过某交叉路口的汽车流可看作泊松过程，若在一分钟内 
没有车的概率为0.2,求在2分钟内有多于一车的概率. 

提示： 先求 A 值，后算概率. 

答 0.831 2. 

【评注】泊松分布常见计算题的一种.知道某个概率就能求 A 
值，知道 A 就能算一切概率. 

45. 若已知 t = 0时，某分子与另一分子碰撞，又知对任何 
t 彡0和 At > 0,若不管该分子在时刻 i 以前是否遭受碰撞，在 
( t,t + At ) 中遭到碰撞的概率等于 XAt + o { At ), 试求该分子在时 
刻 t 还没有再受到碰撞的概率. 

解记/为在时刻 t 还没有再受到碰撞的概率，为 
在 ( t , t + At ) 中未遭到碰撞的概率，依题意有 

P(t + At ) =尸⑷ /"(△<) = P ( t ) [1 - XAt - o ( A <)] 

P{t + At ) - P ( t ) = _ _ P ( t ) o ( At ) 

At - U At 

令 — 0,得微分 方程： 


dP ( t ) 

dt 


-AP(t) 


及初始条件 P (0) = 1, 解该微分方程得 


P{r) = e - At 
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【评注】显示分析方法在概率论中应用的一个小小例子. 
•46. 利用概率论的想法证明下面恒 等式： 




N 


证（巴拿赫火柴盒问题）数学家的左、右衣袋中各放有一盒 
装有 N 根火柴的火柴盒，每次抽烟时任取一盒用一根，在发现一 
盒用光时，另一盒有 r 根的概率为 •. 

( 2 V) 2 — 


易见 



上式两边乘以2〃 并利用组合性质得 

to 


令 fc = iV - r , 则有 


即 



^(N^k\ 1 



【评注】用的是“在发现一盒用光时，另一盒用去 A : 根的概率 
同类题有习题一 *32 题. 

47. 某车间宣称自己产品的合格率超过99%，检验人员从该车 
间的10 000件产品中抽査了 100件，发现有两件次品，能否据此断 
定该车间谎报合格率？ 
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解因产品量很大，所以可认为抽査的100件中的次品数服 
从二项分布，不妨设合格率为 0.99, 则 100 件中次品不少于 2 件的 
概率为（利用泊松逼近） 

p = 1 — (0.99) 100 - 100 x 0.01 x (0.99)" 

» 1 - e _1 - e _1 
= 0.264 2 

这个概率不算小，所以不能据此推定该车间谎报合格率. 

【评注】统计假设检验法之例，可以与《概率论基础》第二章 
§4例2 (血清的试验）对照. 

48. 产品验收方案规定：在一批 20 件产品中，抽取其中 4 件， 
若发现1件或0件次品，则接受此批产品.如果一批20件产品中 
含有 5 件次品，若依上述方案验收，试求这批产品被接受的概率. 
提示： 化为古典概率计算. 

答 0.751 3. 

【评注】 （ n , c ) 方案与 OC 曲线实例. 

M 9. 系统中每个元件正常工作的概率为 p ， 有半数元件正常则 
系统可工作，对什么 p 值， 2 A : + 1个元件的系统比 2 fc - 1个元件的 
系统好？ 

解设 P 2 k^U P 2 k - i 分别为 2 fc + 1个元件和 2 fc - 1个元件的 
系统正常工作的概率，又以 X i 己前 2 fc - 1个元件中工作正常的元 
件数，则 

P 2 k^i = P ( X ^ k - 1) P (后 2 个元件都工作正常） 

+ P(X = A :) P (后 2 个元件中至少有1个工作正常） 

+ P(X ^k + 1) 

= P(X = k - l ) p 2 + P{X = k )( l -( l - p ) 2 )+ P { X ^ k + l ) 
P 2 k-i = P(X = A ) + P(X ^k + l ) 

P 2 fc - f-l — P 2 fc -1 
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= P(X = fc — l)p 2 — P(X = fc)(l - J)) 2 

= (ny ’I-p)v- ( 2A： fc _i y (ih-p ) 2 

= ( 2A： f ^p*(l -p) fc (2p- 1) 

要使 P 2 k-bl > P 2 k -1 当且仅当 ~ < p < 1- 

【评注】直观 解释： 若以少数服从多数的表决方式作出决策， 
则当大家作出正确选择的概率超过 | 时，参加的人数越多越好.类 

id 

似地，在体育比赛中，对高手来说比赛的局数越多越有利 • 

… 50. 通过构造适当的概率模型 证明： 从正整数中随机地选取两 
数，此两数互素的概率等于 I . 

证明如果以递增的次序将素数记上足标： 

Pi — 2, P 2 = 3, P 3 = 5, …， Pfc , … 

并以 4 a 记所取的第一个数能被内整除这一事件，则 

P(A Pi ) = ^ 

Pi 

不难验证， 

P(A Pi A Pj ) = P(A Pi )P(A Pj ) 

即^与/刃独立，这个结果可推广到多个互素数的场合. 
同样以记所取的另一个数能被 Pj 整除的事件，则 

且丑 h 与独立.由选数的随机性，又可知 

P(A Ph B Pl ) = P(A Pk )P(B pt ) 

以 C 记随机取两数，此两数互素的事件，即两数没有公因子， 
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或两数不能同时被某一素数整除，也就是 


C = 「| u B Pi ) 

t=l 

由本章第18, 19题可知， A Pi UB Pi) i = 1,2,--- 3 相互独立,所以有 
P(C) = f[P(A Pi UB Pi ) = fl[l- P(A Pi B Pi ) 

i=l i=l 

= n 1 - p ( A Pi) p ( B Pi)] =n ( x ~ ^) 


下一步证明 



由几何级数 公式: 


1 一适 


1 + -Q + 


^ { P 2 i ) 


2 


+ • • • + 


{Pi) 


+ 


将不超过正整数 iV 的所有素数对应的这样的级数相乘，则部分乘 
积就等于 


Pi^N 1- ' n=l n=l n=AT+l 

这儿的一撇表示累加号并没有管到所有的正整数，只管到那些 
由小于等于 iv 的素数乘积构成的正整数，但显然不大于 AT 的所 
有正整数是由不大于 AT 的素数的乘积构成，故等式右边第一个累 
加是不标以一 * 撇的，由此进一步有 

o<n-^r-E^< E h 

Pi^N 1 一 ^ n=l n=iV+l 
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因级数 £ 4 的收敛性，所以令 N — 0 C 即有 

n=l • 

00 1 00 1 

n-^r=E^ 

i=l 1 一 —s* n=l 

Pi 


有多种途径可求得; _ 


6 


e[-i ， o) 


例如将 _/( 和&二展开为傅里叶 级数: 


f(x) ^i + ^f-tnL cosnnx+ 



E 


n 2 


(一 1 严 ！ ^一 1 ) 71 — 1 


n 3 n 2 


sin rmx 


0 ， x G ( 一 1,0] 

\ > x = ±1 
x 2 , x e (0,1) 


令 o : = 1，稍加整理就可得到 f ；^ = ~ 

n=l 

于是得到所求事件的概率为 

【评注】算术密度因不满足可列可加性难于定义概率而著名， 
这里特殊问题特殊处理，聊备一格. 

在教学札记之十“算术密度”中，有所介绍. 


习题总评 


第二章习题的训练重点是熟练掌握概率的基本公式，以及二 
项分布与泊松分布的计算.加法公式，乘法公式相对容易些，全概 
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率公式用途极广，形式多样，是概率论中最常用的公式，本章和以 
后各章从正文到习题到处都有它的身影.全概率公式在习题中配 
置若干类型，贝叶斯公式在基础概率论中基本上与全概率公式紧 
密相连. 

二项分布与泊松分布通过习题介绍了它们的各种应用并指出 
一些计算的要点. 

独立性是本章引进的最主要概念，因此配置不少习题以助理 
解. 

伯努利概型是概率论中最重要的模型，关于它很少专门设题, 
而是融入二项分布，几何分布，帕斯卡分布的问题中. 


章后小议 


与其他概率论教材相比,本章是多出的一章，其他教材的做法 
是讲过条件概率与事件独立性等概念之后，直接进入以随机变量 
与分布函数为主题的第二章. 

这种与众不同的做法是基于以下的 考虑: 过早引入随机变量并 
把概率计算问题归结到对分布函数的计算容易引导学生忽视概率 
论本身的思想与方法而造成分析化倾向.《概率论基础》用更多 
篇幅处理离散场合和经典模型，因而对伯努利试验的讨论明显加 
强,对各种离散型分布的产生背景有明确的交待，让读者感受更多 
概率直观和经受更多概率方法的训练，这也减轻了下一章引进分 
布时因一大堆分布同时登场而对初学者造成的困惑 

用专节讲二项分布与泊松分布，除强调它们的重要性与紧密联 
系外，也把有关的应用集中处理,并以应用实例的方式介绍了一些 
有实际背景的例题,在历史上这类题目的计算困难导致中心极限定 
理的发现与研究，《概率论基础》大致显示这个发展过程，这些例 
题的最后解决将在第五章实现. 

通过引入原属随机过程论的泊松过程的结构分析，除强调这个 
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结果的重要性，也为下章两列等待时间分布的对比打下基础. 

使用全概率公式,利用独立性之类的假定,通过建立某类方程， 
处理动态模型是随机过程论中最有力的方法之一,本章处理随机游 
动及泊松过程就是它的范例. 


教学札记之3 


对立事件概率等式 


一、引言 

对立事件 A 与1定义为 = 0, 也即 X = 

n-A. 


由加法公式立刻得到 


上式可写成 
或 


P { A ) + P ( A ) = 1 
P { A ) = 1 - P ( A ) 
P ( A ) = 1 - P ( A ) 





称为对立事件概率等式. 

对立事件概率等式可以看作加法公式的特例及变形，也可看 
作减法公式 


P ( A ) = P { f 2) - P ( A ) - 1 - P ( A ) (4) 

的特例. 

它是概率论中最简单的公式，也是最常用的公式之一，有明显 
的概率解释，不过至今尚无通用的简称.可惜逆概率公式已被用来 
称呼贝叶斯公式，否则将是适当的简称. 

这个公式的简单不用解释，但是它的用法却不简单,值得一议. 
下面就围绕这个主题作些归纳. 
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二、用法要诀一避难就易 

P ⑷与 P ( A ) 虽然用一个简单公式相连,但它们计算的难度 
一般并不相同，有时竟大相径庭,这就为避难就易留下余地.个别 
情况下，求 P ( A ) 十分困难繁复，但求 P ( A ) 却甚简便，几乎成了唯 
一的通途.至于具体情况下的处理，大体是采用先试一个然后“碰 
鼻子转弯”的策略，当然也有些熟路可寻. 

《概率论基础》第一章§3—导出对立事件概率等式 (1.3.13) 
就举了两个例子来说明这一要诀，一是用来解决德 • 梅尔问题，另 
一用来解一个特殊的摸球问题. 

下面是另一个例子，取自美国数学竞赛试题. 

题目：一个随机数产生器只能自1，2,…，9这九个整数中选 
一，并且选哪一个都是等可能的，试确定 n ( n > 1) 次选择之后所 
得的 n 个数的乘积能被10整除的概率. 

若以4记所得 n 个数的乘积能被10整除这一事件，则要求 
的是 P ( A ). 对使4发生的有利场合分析发现情况相当复杂，不易 
理出头绪.因此便想到从 P ( A ) 入手一试，即要分析事件瓦它表 
示所得 n 个数的乘积不能被10整除.为做到这点，只要不出 “5” 
就能做到.进一步研究发现，即使出现了 “5”，只要不出现偶数也 
构不成10的倍数.因此定义 

B = { 所选 n 个数中不含 5} 

C = { 所选 n 个数中含5,但不含2, 4, 6, 8} 

这样一来 


显然 

另一方面 
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这里的 5 n 表明 n 个数由1，3, 5, 7, 9组成，而 4 n 表明 n 个数由 
1，3, 7, 9组成，因此 5 n - 4 n 是 n 个数中至少有一个 “5”，余下的 
由1，3, 7, 9中选入的总数，这时选出的数的乘积不能被10整除. 


因此 


P(A) = P(B) + P(C) = 


8 n + 5 n - 4 n 
9^ 


从而 


P(A) = 1 - P(A) = 


9 n - 8 n - 5 n + 4 n 
9^ 


三、配合分布函数计算 

在引进随机变量€之后，概率计算集中于分布函数 F ( x ), 这 
时若记 

A = {^ < x} 

则 _ 

A — x) 

而 _ 

P(A) = P{^ ^ x} = 1 - < x} = 1 - F(x) (5) 


(5) 式的利用在两种场合很 显著. 

其一，离散型分布尾端概率的计算，例如泊松分布计算： 

oo 

Y Pfc = 1 — Po - Pi - P2 
k=3 

这类计算在第二章习题中常见. 

其二，是在生存分析中用生存函数 S ( x ) = P{C ^ x } 代替非负 
随机变量€的分布函数 F ( x ) = P{i < x } 作为工作 语言. 见习题 
三9题. 


四、配合对偶原理作概率计算 
对偶原理 

~ n 

\jAi = f]Ai 

t=i »=i 


( 6 ) 
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门 A = [J ▲ ⑺ 

i=l i=l 

把概率论中的两个很重要的事件联系 起来： 一个是“至少发生其 
一”， 另一个是“一个也不发生”，因而相应地，对立事件概率等式 


n n 


p ( u ^) = i - p ( n ^) 

i=l i=l 

⑻ 

p ( n J 4 i )= i - p ( u ^ i ) 

i—l i=l 

⑼ 

也成为很重要的计算公式. 

到底是化并为交，还是化交为并，要视情况而定，总是选易求 
的一个入手.习题一提供许多例子，值得读者作一个分析和归纳. 
例如第 35 题，第 36 题，第 38 题都是把交化为并，再利用一般加法 
公式而获得解决的. 

五、独立性假定下的一般加法公式 
当•，乂 n 相互独立时， 


p(u^)=i-n[i^p(Aoi 

t=i t=i 

(10) 

特别是当 P(Ai) = p, i = 1 ， 2, …， n 时， 


尸 (0次)=1一(1_妒 

(11) 


是非常有用的公式. 

《概率论基础》第二章§2特设一个小节来讨论它的应用•要 
点有二： 

(1) 独立等概率场合，小概率事件在大量重复试验中必出现. 

n 

P( U A) = 1 (1 — p) n —— ► 1 (0 < p < 1, n 一 oo) 
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(2) 在可靠性理论中的应用，串联对应于交运算，并联对应于 
并运算.在元件的可靠性独立的假定下，各类可靠性计算都可以化 
为并、交运算并利用对立事件概率等式实现. 

实际上，同类的应用在第三章还在继续，表现为极值分布的推 
导.设 Xi , X 2 ,, X n 相互独立，均服从 F ( x )， 则 

P{max(Xi , …， X n ) < x} = P{X\ < x, ••- , X n < x} 

= P{Xi < x} ••- P{X n < x} 

= 刚 71 

这里处理的是 A = {Xi < a :} 的交，有独立性假设，因此好办•但 
当处理 , X n ) 的分布时，就遇到困难，因 

n 

{min(Xi,-- ,X n ) < x} = | (J{Xi < x)| 


所以 （10) 或 （11) 就起作用，这时 

P{min(Xi, … ， X n ) < a:} = 1 - P{min(Xi, … ， X n ) ^ x} 

=1 一 P{Xi ^ x, • • • , X n ^ x) 

=1 — P{X\ ^ x} • * • P{X n ^ x} 
- 1 - [1 - 作 ) r 


这不过是 （11) 的变形.明白了这点，对第三章§3中的有关推导就 
不会感到陌生了. 

I 教学札记之六、 


全概率公式与贝叶斯公式 


一、前言 

oo 

对事件 B，Ah A 2 , • • • ， A n ，■ • _，若成立 B = 次坟则有全概 
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率公式 


⑴ 


P(B) = f^P(A i )P(B\A i ) 

j __ 1 


及贝叶斯公式 

"00 ' ' 

^P(^)P(S|^) 

i=i 


1，2, 



常用的情况之一是{次， i = 1，2, … } 是 I? 的一个分割（亦称 
完备事件组)，即 y^Aj = 17 ,这时显然成立 s AjB ； 另外，也 

1 t=l 

有从 B 作不相容分割出发的.实用上有限 n 与理论上可列和都常 
见.有时干脆写成无限，若事实上只有 n 项，则理解成当 i > n 时 
P ( Ai ) = 0,公式照常使用 • 

这是概率论最重要公式中的两个，也是密切联系的两个， 


二、全概率公式 

化繁为简是解题的基本思路，因此在1657年出版的惠更斯的 
«论赌博中的计算》中就有利用 

P(B) = P{A)P{B\A) + P(A)P{B\A) 

解题思想的不少例证.可见全概率公式很早就被人们所认识 . 事实 
上，用全概率公式解题是一种很自然的想法，而不是一种髙超的技 
巧. 

《概率论基础》正文与习题中用到全概率公式的地方很多，通 
过这些反复进行的训练，相信所有学生对它都会掌握得很好.如果 
在学习之后，同学们能对题型作些归纳整理,肯定会有不少帮助. 

在对随机现象作动态描述或处理（随机过程）中，全概率公式 
甚至用得更多，因为对各种发展可能作全面考察必然用条件化作 
分析，这时全概率公式成为必要的工具.在《概率论基础》中所 
见的例子是对随机游动用差分方程研究吸收概率（赌徒输光问题). 
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历史上关于赌博延续时间的讨论构成第二个例子，这些都在惠更 
斯与伯努利等早期的著作中岀现，并引起后继者的不断研究，从而 
成为近代马尔可夫过程理论的一部分. 

对连续时间过程，《概率论基础》用于导出泊松过程的方法也 
是典型，通过全概率公式研究在 U ， t + At ) 内过程的可能发展情 
况来导出状态概率 P k ( t ) 所应满足的常微分方程，从而得到它的完 
整表达式. 

这类尝试在各种随机过程中进行，最后终于由科尔莫戈罗夫 
在1931年写出了 “概率论中的解析方法” 一篇宏文，进行总结发 
挥，大大推动了随机过程理论的发展，.这一大类过程后由辛钦提议 
称为马尔可夫过程. 

对全概率公式的应用也不断有所创新，它被用于敏感问题的 
调査就是一例. 

敏感问题（吸毒，赌博,作弊）的社会调査一直是个难题，因为 
很难得到被调査人的配合.最后统计学家终于设计出一种调査方 
案，通过迂回，得到答案.该方法简介 如下： 

被调查人在无旁人在场的状态下面对一张问卷，内有两个问 
题： 

问题 A : 你的手机电话号码的末位数是偶数吗？ 

问题 B : 你是否作弊过？ 

后附有操作说明：先从旁边的袋子中摸出一球，若为黑球则回答问 
题 A ， 若为白球则回答问题 B . 

这个方案大大消除了被调査人的顾虑，因而能得到真实的回 
答.假定对 n 个人作调査，得到 fc 个“是”的回答，那么统计学家 
就能利用全概率公式来推算作弊率 P . 

记袋中的白球的比例为 7 T ， 黑球的比例为1 - 7 T ， 则尸(白 ） = 7 T ， 
P (黑)=1 - TT ， P (是 | 白）= P ， P (是1黑 ) = 0.5,于是回答“是”的概 
率为 


P = 7 rp + (1 — 7 r ) x 0.5 
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从而 


p = 


P -0.5(1- tt ) 


把频率 t 作为概率 P 的估计代入，则得 

71 

— 一 0.5(1 — 7 r ) 

P= n - (3) 

7T 

当 n 足够大时，相信能得到较可靠的作弊率估计值. 

显然，在这个方案中为获得真实的信息作出了一定的牺牲.回 
答问题 A 的人的答卷不但无用而且带来混淆.还有，若在袋中放 
入更多的白球能使信息的收集更加有效，但这样一来又会增添被 
调査人的顾虑. 

无论如何，这个设计是聪明的. 

三、贝叶斯公式 

初看贝叶斯公式 （2) 不过是条件概率定义，乘法公式和全概率 
公式的简单组合，它表明 

P(Ai\B) = CPiA ^ PiBlAi ), 1，2 ,…， n 

或 

P(Ai\B) a P{Ai)P{B\Ai), i = 1，2,… ， n 

事实上，在一些应用中，只关心哪个 i 使上述条件概率达到最 
大，根本不必计算 C . 当然在另一些问题中又必须计算 C ， 这时 C 
的计算成为使用贝叶斯公式的一大难点，导致大量研究，例如上世 
纪末 MCMC 方法的大发展，这也是动力之一. 

不过，现代概率论与统计学者都认识到贝叶斯公式实在含有深 
意，贝叶斯其人实在了不起. 

托马斯 • 贝叶斯 (1702 — 1761) 出生于伦敦一个新教家庭，其 
父是牧师，由家庭教师传授知识.有学者推测，贝叶斯的家庭教师 
之一可能是棣莫弗 (1667 — 1754). 棣莫弗是法国的新教教徒，18 
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岁时因参加宗教骚乱被监禁两年，获释后由法国移居气氛较好的 
伦敦，一直以家庭教师为业来维持生活.贝叶斯12岁时，伯努利给 
莱布尼兹写信说“贫困的棣莫弗在伦敦不得不以教数学为生”.棣 
莫弗是第一流分析学家和概率论学家，受到牛顿等人的髙度评价， 
于1697年当选皇家学会会员，而托马斯的父亲也是皇家学会会员， 
托马斯在概率论的研究与棣莫弗的工作有关，在论文中也曾多次 
提起后者，但没有他们交往的直接证据. 

托马斯 • 贝叶斯也做牧师，一生未婚，从事神学与数学研究， 
但只写过两本小册子，1731年的一本关于神学，1736年的一本关 
于“流数学”，1742年被接纳为皇家学会会员，1752年退休，1761年 
逝世. 

贝叶斯于逝世前4个月把两篇遗稿寄给好友 Richard Price 
(1723 — 1791), Price 是一位名人（社会保障先驱者)，不负朋友所 
托，最后这两篇文章都在皇家学会的刊物上发表.一篇关于级数， 
另一篇就是我们要介绍的“论机会学说中一个问题”.该文于1763 
年12月23日在皇家学会上宣读，刊于1763年的《哲学学报》， 
200年后在1958年的 Biometrika 中重刊. 

贝叶斯论文名为 “An essay towards solving a problem in the 
doctrine of chance ”， 由 R . Price 注释出版.中国读者可在1992年由 
中国统计出版社出版的普雷斯著《贝叶斯统计学》中读到该文的 
中译文. 

关于这篇著名的论文,现作如下简介. 

一开头作者就十分明确地提出论文要解决的问题. 

问题： 给定一个未知事件发生和失败的次数，求其在一次试验 
中发生的概率位于两个任食指定的概率度之间的机会. 

若以0记事件4在一次试验中出现的概率，以； C 记4在 
n 次独立试验中发生的次数，而 0< ci < b < l ， 贝叶斯要求的是 
P{a ^ ^ 6 1 X = x }. 

在伯努利试验中，已知 P ， 求 X 的分布是概率论中研究的主 
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题，这里则是已知 X = 0：，要求 P 落在某一区间的概率，事实上属 
于统计问题.雅科布 • 伯努利已关心由试验结果求概率的问题，后 
来丹尼尔 • 伯努利第一个提出这个问题,现由贝叶斯完全明确表述 
并给予解答，自然意义重大，通常称为逆概率问题，因此贝叶斯公 
式也常被称为逆概率公式.在这些先驱者眼中，概率统计本来就是 
一家 • 

为了解决这个问题，贝叶斯先提出7个定义，后建立10个命 
题. 

其7个定义 如下： 

定义： 

1. 如果几个事件其中一个发生时，其他均不发生，我们称几个 
事件是互不相容的. 

2. 如果两个事件其中总有一个发生，但两个不能同时发生，我 
们称这两个事件是对立的. 

3. 我们称一事件失败，是指它没能发生，或者它的对立事件发 
生. 

4. 当一个事件已经发生，或者已经失败，我们称它被确定了. 

5. 任一事件的概率，等于应予以计算的依赖于该事件发生的 
预期值与该事件发生时所期望的值之比. 

6. 我们所说的机会就是概率. 

7. 事件是相互独立的，如果其中任一事件的发生既不增加也 
不减少其他事件的概率. 

这里的定义6强调问题中所说的机会就是概率.而定义5则 
给出一个与众不同的概率定义.据 Price 转述，贝叶斯“这么做的 
愿望是为了消除关于这个词的词义的所有争议，因为在普通语言 
中，针对它用于过去或未来的事件的不同情况，持不同观点的人对 
它有不同的理解，但是，不论对它的理解有何不同，都允许对依据 
过去的事情的真实性或任何将来事件的发生的预期作出估计，越真 
实的事情越有价值，或者说这事件越会发生.于是，他提出无论概 
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率这个词在什么情况下被使用，都允许对它给出合适的测度，因而 
不会管对这个词如何恰当理解 

其他定义与我们现在的理解几乎完全一致. 

接下来，贝叶斯提出10个命题及若干推论，命题3给出乘法 


公式 P ( AB ) = 命 

题5给出条件概率定义 P ( A \ B ) = 

命题7则导出二项分布，论 

文的第一部分至此突然结束. 

第二部分以如下台球桌模型开 
始. 

假设: 

1. 假定方球台或方平面 ABCD 
这样制成并水平放置，使得将球0或 
球 W 中任意一个掷于其上时，它落 
在其上的任意一个相等部分的概率 



都相同，而且它必落在其上的某个部 
位. 


图 2-1 


2. 假定首先掷球 V ，通过它的落点画一条平行于 4 D ， 分别交 
CD 和 AS 于 s 和0的线段似，然后掷球 O p + g 次或 ri 次，如果 
在一次抛掷中它落在 和⑽ 之间，我们称事件 M 在一次试验 
中发生. 


在这两个假定之后，用几何方法证明了下面两条在我们看来 
是明显的引理. 

引理1点 o 落在线段上的任意两点间的概率是这两点 
间的距离与线段 AS 之比. 


引理2掷球 VT ， 画出 os ， 那么在一次试验中事件 M 的概率 

io 

LB* 

接着又用繁复的几何方法证明了命题8,按现代记号即 
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命题 8 P{X = x , 
推论 P{X = ar } = 

然后用命题 5 推出 

命题9 


a ^ ^ ^ 6} = J 

rOm^T ， 

x = 0,1 ， 2,… ， n, n = 1,2, ••• 


P { a ^6 ^ b\X = x } ^ 


(n + 1)1 
x\(n — x )! 



之后贝叶斯给岀如下著名而引起巨大争议的“附 注”： 

附注 “…… ， 当我们在任何涉及某事件概率的试验进行前 
对该事件发生的概率还一无所知的情况下，在此事件中应用这条 
原则是合适的.似乎可以这样设想，换句话说，对于这样一个事件 
没有理由 认为: 在一定数目的试验中，它将更有可能发生某一次数 
而不是其他•，， 

这就是假定未知概率0服从 [0,1] 均匀分布，后人称之为“同 
等无知”原则或“贝叶斯原则”. 

这样就有了最后答案， 

f e x (i-9) n ~ x de 

命题 10 = ^- 

f e x (i - 6) n ^ x de 

Jo 

由于最后的答案包含了不完全 B 函数，因此计算是一大问题, 
这吸引了贝叶斯的许多注意力. 

从现在的观点看，贝叶斯的确提出了一整套归纳推理方案，指 
明了解决问题的一种思路.但与后来占主流地位的频率学派有很 
大分歧.至少有如下几点： 

(1) 把0看作随机变量.在频率学派看来，0虽未知，但是常数. 

(2) 先验分布 p (0) 的给定对最终答案关系重大，如何给定？ 

(3) 对“同等无知”原则不认同，例如对0 “同等无知”与对沪 
“同等无知”如何协调？ 
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(4) 把概率看作信任程度的度量，即主观概率. 

古代的拉普拉斯，近代的 Jeffreys , de Finetti ， Wald , Savage ， 
Lindley 等都对贝叶斯方法做出贡献，使贝叶斯学派不断得到发展. 

把概率作主观的信任程度的度量，在许多学科（例如金融学) 
盛行，与公理化体系也并不矛盾，似乎不能简单排斥.下面通过一 
个例子来说明. 

《伊索寓言》中“孩子与狼”的故事和中国古代“周幽王烽火 
戏诸侯”的故事等信任度丧失的例子或可用贝叶斯公式来作定量 
分析 • 

某山村有一小孩，每天上山放羊，山里有狼出没.有一天，他 
兴致所至，大喊“狼来了，狼来了”.山下村民闻言赶来才发觉受骗. 
第二天仍然如此.第三天真的有狼前来，但不管孩子怎样叫也无人 
来救他了. 

若以 P ( A ) 记村民对该小孩的信任度，假定为0.8,以丑：记该 
小孩有了第一次说谎，设 

P ( B l \ A ) = 0 . 1 , P ( B !|^[) = 0.5 


则 


岸|历） 


P ( A ) P ( B l \ A ) 


P ( A ) P ( B 1 \ A ) + P ( A ) P ( B l \ A ) 
0.8 x 0.1 


0.444 


0.8 x 0.1 + 0.2 x 0.5 
这表明村民受第一次骗后，对小孩的信任度由 0.8 降为 0.444. 
第二次说谎后 

0.444 x 0.1 


P ( A \ B 2 ) 


0.444 x 0.1 + 0.556 x 0.5 


0.138 


因此经两次说谎，小孩在村民中的信任度已从 0.8 下降到0.138,难 
怪第三天无人上山搭救他. 
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教学札记之七 I 


遗传学和槪率论 


一、 前 S 

孟德尔 ( Mendel , 1822 — 1884) 创始的遗传学理论对简单的概 
率模型的适用性提供了一个富有教益的例证. 

遗传学规律是由奥地利修道士孟德尔发现的.他从1856年在 
修道院的花园里种植豌豆，开始他的“豌豆杂交试验”，到1864年 
共进行了 8年，终于发现了前人未认识到的规律.这些规律后来称 
为孟德尔定律，是现代遗传学的基础. 

孟德尔选用豌豆为试验植物，从中选取了它的7个稳定的、易 
于区分的单位性状 ( character ) 作为观察分析的对象，它们是种子 
的形状（相对性状为圆粒和皱粒)，花的颜色（红花和白花)，子叶的 
颜色（黄色和绿色)，豆荚的形状（膨大和缢缩)，豆荚的颜色（绿色 
和黄色)，花的位置（腋生和顶生)，茎的高度（高茎和矮茎).他在豌 
豆开花时进行品种之间授粉杂交的反复试验和精密统计分析，终于 
在34个豌豆品种子孙后代的 2.8 万多棵植株里，找到了遗传和变 
异的秘密. 

孟德尔认为，每一种性状都含有一种遗传因子，生物的遗传性 
状都是由遗传因子决定的，并提出了遗传学的两个基本定律：分离 
定律 (law of segregation ) 和独立分配定律 (law of independent as ¬ 
sortment ). 

二、 一对遗传因子的杂交试验 

只有选择生物性状能够代代稳定相传的植株为亲本 ( parents ) 
进行杂交，才能确定子代的遗传基础.豌豆是一种严格自花授粉的 
植物，没有人为干预时，多代自花授粉可形成纯系，因此孟德尔选 
定了豌豆作为实验对象.他从尚未成熟的花里除去雄蕊，阻止了自 
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5 474 圆粒 1 850 皱粒 

2 . 96:1 

705 红色 224 白色 

3 . 15:1 

6 022 黄色 2 001 绿色 

3 . 01:1 

882 膨大 299 缢缩 

2 . 95:1 

428 绿色 152 黄色 

2 . 82:1 

651 腋生 207 顶生 

3 . 14:1 

787 髙茎 277 矮茎 

2 . 84:1 


种子形状 圆粒 X 皱粒 
花的颜色 红花 X 白花 
子叶颜色 黄色 X 绿色 
豆荚形状 膨大 X 缢缩 
豆荚颜色 绿色 X 黄色 
花的位置 腋生 X 顶生 
茎的高度 高茎 X 矮茎 


孟德尔为了解释这些结果，提出下面的遗传因子分离假说. 

(1) 生物的性状是由遗传因子控制的，相对性状是由细胞中成 
对的遗传因子控制的. 

(2) 遗传因子在体细胞中是成对的， 一 个来自母本，一个来自 
父本.在形成配子时，成对的遗传因子彼此分离，并且各自分配到 
不同的配子中去，每一个配子中，只含有成对因子中的一个. 

(3) 遗传因子在遗传的过程中始终保持为一个独立不变的遗传 


花授粉和自体授精，到植株成熟的时候，从具有相对性状的植株上 
采取花粉，进行人工异花授粉，这种杂交实验称为相互杂交（孟德 
尔既做正交也做反交，结果一致). 

在杂交实验过程中，孟德尔注意到由相互杂交所产生的子一 
代（巧）的性状总是跟一个亲本的性状相似.以圆粒种子和皱粒种 
子这一对相对性状为例说明.圆粒种子的豌豆与皱粒种子的豌豆 
杂交得到的杂种子一代 G 全部为圆粒. 再让朽 自交得到子二代 
F 2 , 孟德尔从253棵植株上得到7 324粒朽种子，其中5 474粒 
为圆粒，1 850粒为皱粒，二者的比例为 2.96 : 1. 孟德 尔将巧 表现 
出来的亲本性状叫做显性性状 (dominant character ), 把没有表现 
出来的亲本性状叫隐性性状 (recessive character ), 本例中圆粒是显 
性性状而皱粒是隐性性状. 

在豌豆的其他6对相对性状的杂交中，孟德尔都得到了相同 
的试验结果：巧中两种性状的比例均接近于3 : 1，见 下表： 


性状的类别 亲本性状 ^性状 f 2 性状表现及数目 f 2 比例 




• n.g. 






单位, 杂种八 体细胞内的遗传因子，互不沾染. 

(4) 成对遗传因子具有显隐性关系.杂种一代表现一种表现型， 
控制这种表现型的因子是显性因子，相对应的是隐性因子. 

(5) 杂种产生的不同类型的配子数目相等.雌雄配子随机结合， 
即不同类型的雌雄配子有同等的结奋机会，并且合子有同等的发育 
和存活的能力. 

这样一来，孟德尔对他的杂交试验结果进行了科学的解释.通 
常将孟德尔的遗传因子用英文字母代表，大写字母代表显性遗传因 
子，对应的小写字母代表隐性遗传因子.例如用 i ? 代表控制圆粒 
种子的显性遗传因子， r 代表控制皱粒种子的隐性遗传因子. 

分离现象可用图 2-2 说明： 

P 狀（圆粒 ）X rr (皱粒） 

I I 

配子 R r 



办（脚粒) 


I® 尽自交 



图 2-2 


孟德尔的分离定律可表示如下：成对的遗传因子的两个成员 
在形成配子时相互分离，各自进入到不同的配子中去，因此一半配 
子中携带成对遗传因子的一个成员，而另一半配子携带成对遗传因 
子的另一个成员，雌雄配子的结合是随机的.一般情况下，配子分 
离比是1: 1，巧遗传型分离比是1:2:1, F 2 表现型分离比是3: 1. 

孟德尔还设计了许多其他实验来验证上述结果，都得到一致的 
结论，从而建立了遗传因子的分离定律. 




三、两对因子的杂交试验 

根据孟德尔分离假说，一对遗传因子在形成配子时各自分离. 
那么当两对或两对以上的遗传因子在形成配子时又有什么特征呢？ 
为此孟德尔又研究了两对遗传因子的遗传现象. 

孟德尔仍以豌豆为实验材料，选取具有两对相对性状差异的 
纯系亲本进行杂交.例如，用一个亲本是圆粒和黄色子叶的种子与 
另一个亲本是皱粒和绿色子叶的种子.其子一代 巧 都结圆粒和黄 
色子叶，表明圆粒和黄色子叶都是显性，这与7对性状分别进行研 
究的结果是一致的. 

由朽 种子长成的植株（共15株）进行自交，得到556粒 F 2 
种子，共有4种类型，其中两种类型和亲本相同，另两种类型为亲 
本性状的重新组合，而且存在着一定的比例关系，如图2-3: 

p 圆粒、黄色 x 皱粒、绿色 

\ 

6 圆粒、黄色 

F 2 圆粒黄色圆粒绿色皱粒黄色皱粒绿色总数 

实得种子粒数 315 108 101 32 556 

理论比例 9 ： 3 : 3 : 1 16 

图2-3 

如果我们把种子形状和子叶颜色中的相对性状分别进行统计， 
可得如下 结果： 


种子类型 

数目 

比例(％) 

形状 <赚 
\皱粒 

315+108=423 

76.1 

101+32=133 

23.9 

子叶 〈黄色 
\绿色 

315+101=416 

74.8 

108+32=140 

25.2 


每一对相对性状的分离比例都接近3:1，符合分离规律. 
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如把两对性状联系在一起分析， 巧 表现型的分离比例是9:3: 
3:1，可通过下列表示法 展示： 


3 圆 ： 1 皱 
X 3 黄 ： 1 绿 
9 圆黄 7 3 围绿： 3 皱黄 7 1 皱绿 


图 2-4 

孟德尔在实验的基础上总结出了独立分配定律，亦称自由组合 
定律.其要 点是： 决定着相对性状的遗传因子在遗传的传递上有相 
对的独立性，可以互不干涉，在形成配子时，可以互相随机地进行 
自由组合_ 

若 以丑和 r 分别代表种子的圆粒和皱粒，以 F 和2/分别 
代表子叶的黄色和绿色.那么纯系圆粒黄色种子亲本的遗传型为 
RRYY , 纯系皱粒绿色种子亲本的遗传型为 rryy , 独立分配现象可 
用下图 说明： 

P 

配子 


RRYY ( 圓粒黄色 ）X rryy ( 皱粒绿色 ) 

\ \ 

RY ry 



RrYy ( 圆粒黄色 ) 


子 

雌配 ^\ 

RY 

rY 


ry 

RY 

RRYY 

RrYY 

RRYy 

RrTy 

Fi rY 

RrYY 

rrYY 

RrYy 

rrYy 

办 

RRYy 

RrYy 

RRyy 

Rryy 

ry 

RrYy 

rrYy 

Rryy 

rryy 


图 2-5 

因此，圆黄，圆绿,邹黄，皱绿之比正好是 9:3:3:!. 
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孟德尔也设计了许多其他实验来验证遗传因子的独立分配定 
律，都得到一致的结论. 

回归本题，若用概率论语言，则分离定律断言在 A 植株的花 
粉母细胞进行分裂时，其所形成的雄配子总体中带有和 r 的雄 

配子概率各为而独立分配定律则断言两对性状是相互独立的. 

当然这些结论的成立是有条 件的， 进一步的研究带来了孟德尔 
定律的补充与发展，但孟德尔定律莫定了当代遗传学的坚实基础， 
也宣布了概率统计成为研究生命现象的重要数学工具. 


四、后语 

1865年孟德尔宣读了他的《植物杂交实验》论文并于次年正 
式发表，但被长期埋没，直至1900年另外三位不同国籍的科学家 
同时重新发现这些规律，才重见天日.从此孟德尔在生物领域具有 
里程碑性质的科学实验被载人史册.1909年丹麦遗传学家约翰逊 
正式命名孟德尔所称的“遗传因子”为“基因” ( Gene ), 一直沿用 
至今. 

下一个对遗传学做出重大贡献的是美国的摩尔根，他通过对 
果蝇的研究，发现连锁遗传，建立了遗传学的第三条定律一■连锁 
与互换定律，创立了 “基因论”，并把抽象的基因概念落实到染色体 
上，大大地发展了遗传学. 

1953年美国科学家沃森和英国科学家克里克发现了 DNA 的 
双螺旋结构，对遗传学的发展做出重大贡献，标志着分子遗传学时 
期的到来. 

当代的一大盛事是人类基因组计划 ( HGP ) 的启动，该计划已 
于2003年完成了人类基因组全部序列的测定，正进入彻底阐明基 
因组编码的蛋白质的功能及 DNA 序列中所包含的遗传信息的生 
物功能的新阶段. 
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教学札记之 习 


分赌注问题 


经过 150 多年对概率论发展早期史料的收集、整理、考订与 
研究，目前大多数人已同意此前 （1837 年） 泊松 （1781 —1840) 作 
出的 论断： “由某广有交游者向严肃的詹森派信徒提出的一个博弈 
问题乃是概率演算的起源”.这个博弈问题就是分赌注问题，古代 
一般称作点数问题. 

一、分赌注问题的由来 

分赌注问题大意如下 ： A B 两个赌徒按某种方式下注赌博，说 
定先胜 s 局者将赢得全部赌注，但进行到4胜^局， S 胜&局 
( S ! < s ， 的 < s ) 时，因故不得不中止,试问如何分配这些赌注才公 
平合理？ 

这个分赌注问题大概相当古老，因为至少在帕乔利 ( PacioU , 
1445-1517) 出版于 1494 年的《算术、几何、比与比例集成》的 
专门论述“稀奇问题”的一^节中已经出现，其中 5 = 6, Si =5, 82 = 2. 
这个问题知道的人也应该相当多，因为上述书籍是当时流行的百 
科全书式数学教科书. 

帕乔利把这个问题看作一个比例问题，提出以^比分赌 
注.其论证思 路是： 原定的先胜 s 局者为贏者的玩法至多在2卜- 
1) + 1 = 2 s - 1局内可完成，因此赌注应按比分配. 

ZS — 1 25 — 1 

在这个论证中既没有概率也没有组合. 

这个答案受到当时最大的赌徒与数学家卡尔达诺 ( Cardano , 
1501 — 1576) 的反对，他在发表于 1539 年的一篇文章中认为“帕 
乔利按照已经贏得的局数成比例地分配赌金，但没有考虑尚待每 
个赌徒去贏的局数卡尔达诺虽有概率想法也深通组合理论但对 
分赌注问题也提不出正确解法.不过在当时的数学家中只有他意 
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识到分配规则不取决于 （ s ， h ， s 2 ) 全体而只与未胜局数 S - 以及 

S — S2 

另一个当时著名数学家塔塔利亚 ( Taxtaglia , 1499一 1557) 在 
出版于1556年的《论数学与度量》中也批评帕乔利，他举例说如 
果4先胜10点， S 未胜过，难道赌注全归4所有？并怀疑这个问 
题是否有数学答案，他认为是一个司法的问题，不过他也提出自己 
的答案： 5 + 51 — 52 比 S - Si + S 2. 

1558年 Pereron , 1603年 Forestani 都对此写过文章，但都未 
提供正确答案. 


二、帕斯卡与费马的通信 


德 • 梅尔 (1607—1684) 就是那位“广有交游者”.他与巴黎数 
学家有广泛联系，也喜欢赌博，后来还出入宫廷.他向帕斯卡提出 
至少有两个问题，一个掷骰子问题，另一个就是分赌注问题，正是 
这两个问题引起了帕斯卡与费马的通信. 

帕斯卡 (1623 — 1662) 是历史上有名的“数学神童”，8岁后生 
活在巴黎.父亲也是数学家，他经常带儿子参加巴黎的各种科学聚 
会，特别是每周一次的梅森家聚会.梅森因数论中的梅森素数而在 
数学史上留名.这种环境与经历让帕斯卡在16岁就写出《试论圆 
锥曲线》（1640)，20岁发明手摇计算机，对射影几何也有重要贡献， 
成为该学科开拓者之一.但他身体多病，笃信神学，身心颇受折磨. 


费马 (1601 — 1665) 一生生活在法国南部的图卢兹，在该地受 
教育，成为律师，后任议会顾问三十余年，过着富足的生活 . 30多 
岁才研究数学，全凭爱好、天赋和顽强精神，成为数论学科的创始 
人，并以大、小费马定理享誉数百年_，与笛卡尔平分解析几何发明 
权； 对于求曲线的切线和求平面曲线所围区域的面积也有诸多发 
现，就是没有看出二者的联系而与微积分发明权失之交臂.他从不 
发表文章，许多证明也未写出.他靠与当时知名数学家的通信互通 
信息.他的文集是在他死后由他的儿子于1679年编辑出版的. 
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帕斯卡与费马关于概率论的通信共有 7 餘 

1. 帕斯卡给费马第一封信(已丢失). 

2. 费马给帕斯卡回信（无日期). 

3. 1654年7月29日（星期三）帕斯卡给费马的第二封信 • 

4. 费马给帕斯卡信（丢失). 

5. 1654年8月24日帕斯卡给费马的信. 

6. 1654年8月29日费马给帕斯卡的信. 

7. 1654年9月25日费马给帕斯卡的信. 

从后面通信内容可以推测：第一封信中帕斯卡向费马提出了 
掷骰子问题和分赌注问题. 

费马在第二封信中对掷骰子的计算问题提出自己的解法并指 
出帕斯卡的一个错误. 

第三封写于7月29日的长信是帕斯卡在病中完成的，当时他 
很兴奋，因为前一天他从 Carcavi 处收到费马的一封信，谈到对分 
赌注问题的解法.信中帕斯卡对费马的解法表示赞同，承认自己的 
错误，对分赌注问题提出自己的解法（见下文)，也谈到德 • 梅尔曾 
向他和 Roberval 提出骰子问题. 

第四封信虽丢失，但可以肯定是费马对分赌注问题提出自己的 
解法，这些解法在帕斯卡8月24日的回信即第五封信中有详细叙 
述. 

第六封信中费马提到收到了 “论算术三角形”拷贝.从中可以 
看出帕斯卡在说算术三 角形” 一文（发表于1665年）中发表的解 
法，也列入这次通信讨论之中. 

第七封信中费马提出 “Waiting time argument ” 导出了现称为 
“帕斯卡分布”的表达式. 

在这些通信中可以看出帕斯卡与费马都用组合方法正确解决 
了分赌注问题.帕斯卡也用递推法，并提出差分方程的显式解等同 
于组合解.最后费马发现帕斯卡分布.所有讨论都假定4、 S 两人 
的赌技相同，即每人都有同等可能胜每一局，这样才是古典概型. 
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两人都没有用“概率” 一词，而代之以“值”，三年后惠更斯改称数 
学期望 • 

下面分别介绍二人的解法. 


三、帕斯卡的解法 

帕斯卡的初始解法出现在7月29日写的信中，对两人各投入 
32枚金币，以先得3分者为贏的场合作出详细解答.原文如下： 

下面给出在两个赌徒之间分配赌金的方法.例如每人 
投放32枚金币作为赌金，并以先得3分为贏. 

假设第一个人已得2分，另一个人只有1分.他们掷 
下一次时,若第一个人贏了，他将得到全部64枚 金币； 若 
另一个人贏了，他们的比分是2:2,如果在这种情况下分 
赌金的话，每人将拿回自己所下的赌金即32枚金币. 

综上所述，第一个人如果贏了，64枚金币将属 于他； 如 
果输了，32枚金币将属于他.假如他们不希望玩下去而 
要分赌金的话,第一个人应 该说： “我一定能得32枚，即 
使我下一轮输了，也应把它们给我.至于另外的32枚金 
币，也许我得到它们也许你得到它们，机会是均等的.所 
以，在我得32枚金币之后，再让我们均分另外的32枚 
吧这样，他将得到48枚金币，而另一个人只能得到16 
枚. 

现在假定第一个人得2分而另一个人得0分,他们正 
在争夺下一分.如果第一个人贏了，他将得到全部64枚 
金币.如果另一个人贏了，注意他们将回到前面的情况， 
即第一个人有2分而另一个人有1分. 

但我们已说明了在这种情况下，已有2分的人将得到 
48枚金币.所以，如果他们不希望继续赌下去的话，这人 
应该说：“如果我贏，我将得到全部64枚 金币； 如果我输 
了，48枚金币将属于我.所以请先把48枚金币给我，然 
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后再均分这剩下的 16 枚，因为你我贏得它的机会是均等 
的于是，他获得金币的数目为 

48枚+8枚= 56枚. 

现在假定第一个人有1分而另一个人为0分.先生请 
• 看，如果他们再掷一次而第一个人贏了，他与对手的比分 
将是2比 0. 根据前述理由，56枚金币将属于他.如果他 
输了，他们的比分成为1比1，32枚金币将属于他.所以 
他应该说：“如果你不打算赌下去，就请把我原来的32枚 
金币给我,再让我们把56枚金币的剩余部分均分 . 56减 
去32为24,让我们来平分这24枚金币吧.你拿12枚我 

拿12枚，再加上我原来的32枚，我一共应得44枚金币 
从这个解法中可以看到几个 要点： 其一是充分利用两人在每 

一局中胜负的等可 能性； 其次是一种递推的思想.这些在“论算术 
三角形” 一文中都得到进一步阐述，并结合组合公式的递推性推广 
到一般场合，得到分赌注问题的正确解答公式. 

“论算术三角形”发表于1665年，但是完成于1654年，当时 
就有巴黎数学家看到此文，而且费马在8月29日的通信中也提到 
收到该文的副本. 

在“论算术三角形”中，帕斯卡给出了一般 结论： 若某人输时 
得赌金为&而贏时得赌金 s + t , 则赌博中断时应得赌金 s + f 从 

现在的观点看，他用的是条件期望公式： 

EX = [ E { X \ A ) + E ( X \ A )]/2 ⑴ 

这里显然利用了等可能性.至于递推法，在一般场合，若按现代术 
语，以 e ( a , 6) 记当 A B 各缺 a ， &个胜局时 A 最终贏的概率.这时 
可建立差分方程 

e ( a , 6) = [ e(a —1,6) + e ( a , b — l )]/2 (2) 


边界条件则为 

e (0, b ) = 1, e ( a , 0) = 0, e ( a , a )=— 
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利用算术三角形的性质及数学归纳法，帕斯卡最终得到 



⑻ 


并接近于建立递推公式 

2 [e(a ， b) - e(a + 1,6)] = + : ^ ( 备 ) + 

特例 

3 

a = 1, & = 2 ， e(a, 6) = — 




e(a, b)= 




a = 2 ， 6 = 3, e(a, b)=— 

lb 

因此 4 得的赌金分别为 

3 7 11 

64 x - = 48, 64 x - = 56, 64 x — = 44 

4 8 16 

与信中的结论一致. 

帕斯卡利用组合理论，差分方程与递推法终于给分赌注问题以 
完满解答. 


四、费马的解法 

费马的解法主要通过帕斯卡在8月24日回信中复述而得知. 
如两赌徒 A B 离全胜所差局数分别为 a 与 b ， 则最多再进行 a + 
6-1 局就能决定胜负.假定赌博继续进行，则共有2^^^种等可 
能结果.以 a = 2, & = 3为例，则有22+ 3 - 1 = 16种等可能结果.若 
以4表示 A 胜， B 表示 S 胜，则有以下16种 情况： 

AAAA AAAB AABA ABAA 
BAAA ABAB ABBA BABA 
BBAA BAAB AABB BBBA 
BBAB BABB ABBB BBBB 
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其中对 4 有利的场合数为11，对 S 有利的场合数为5,因此 

e(a，&) =菩. 

在回信中帕斯卡对费马的解法是折服的，表示费马的方法很 
可靠，并说已把费马的解法转告巴黎的一些数学家.但有人持疑， 
例如 Rx)berval 认为这一些皆在虚构中进行，因而不可确信. 

因为实际上的确赌博在一方达到胜利就结束，很少要再进行 
到 a + & - 1 局的， Roberval 等数学家的疑虑是合理的，这也推动 
费马再作进一步研究.因此在费马于9月25日写给帕斯卡的信中， 
特别指出在虚构的赌博中讨论点数问题并不影响赌金的分配结果. 
例如对 a = 2, 6 = 3的情况，4能够在再进行2局、3局和4局中 
取胜的方式为 

AA ; ABA 9 BAA ; ABBA , BABA , BBAA 

每个排列都有 2 个 4 并且其中一个出现在最后位置.在进行2局 
时，有2 2 种可能，只有 AA —种让4 得胜； 在进行3局时有2 3 种 
可能，只有 ABA , BAA 2 种让>1 得胜； 在进行4局时有2 4 种可 
能，其中只有3种让4得胜，故 

1 2 3 11 

^( 2 , 3 )= 22 + 23 + 24 =- 

费马在信中也指出可将结果推广到更多局的场合. 

最后费马用 “Waiting time argument ” 找到 

价 ㈣ (Hr ( 5 ) 

这是《概率论基础》中 (2.3.13) 当 p = g = ^时的 特例. 该式用 
到现称的“帕斯卡分布”. 

通过上述讨论，可见帕斯卡并未涉及这种分布，而费马倒是达 
到它.因此称这种分布为“帕斯卡分布”似有不妥. 

在评述帕斯卡与费马的历史性突破时不要忘了当时的时代背 
景与科学水平.在1654年代，微积分尚未发明，组合理论很不完 
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善.须知排列还有待于这年出生的雅科布 • 伯努利来定名，而组合 
符号要等欧拉 (1707—1783) 来引进. 

五、惠更斯的贡献 

惠更斯 （1629 —1695) 是17世纪欧洲科学界的中心人物之一. 
1655年秋惠更斯为了得到安格斯基督教大学的法学博士学位到了 
法国并在巴黎住下.他在那儿见到了许多有名的科学家.他对 My - 
lon 和 Roberval 给他介绍的帕斯卡和费马所研究的新问题印象很 
深.他还听到了分赌注问题.但是没有人告诉他这些问题的解以及 
费马和帕斯卡的方法. 

1655年底惠更斯回到荷兰便独立研究这些问题并解决它们， 
写成《论赌博中的 计算》 送其恩师 V , Schooten 审阅，后者正在 
筹印《数学习题集》，就建议他印刷发表，并亲自替他译成拉丁文. 
其后惠更斯通过 Carcavi 与费马联系上，费马又向他提出5个新 
问题.在1657年3月书稿最后一次校订时，惠更斯将其论文增加 
为14个命题和5个问题，该书出版于1657年9月，以1657年4 
月27日惠更斯给 V . Schooten 的信作为序言，而荷兰文版出版于 
1660 年. 

该书先给出一条公理和14个命题 

公理每个公平博弈的参与者愿意拿出经过计算的公平赌注 
冒险而不愿拿出更多的数额，即赌徒愿意押的赌注不大于其获得 
赌金的数学期望. 

命题 1若得到^或{>的机会相等，则其值是 

命题 2若得到 a , 6或 c 的机会相等，则其值是 a - g - C . 

命通 3如果得到 p 次 a 和 g 次 b 的机会相等，则其值是 
pa + qb 

P + 9 

命题 4假设两人一起赌博，离全胜所差局数分别为1，2时， 


- 131 - 



其赌注如何分配？ 

命题5假设两人一起赌博，离全胜所差局数分别为1，3时， 
其赌注如何分配？ 

命题6假设两人一起赌博，离全胜所差局数分别为2, 3时， 
其赌注如何分配？ 

命题7假设两人一起赌博，离全胜所差局数分别为2, 4时, 
其赌注如何分配？ 

命题8假设三人一起赌博，离全胜所差局数分别为1，1，2 
时，其赌注如何分配？ . 

命题9假设 n 个人一起赌博，离全胜所差局数分别为 ri ， r 2 , 
•••， r n 时，其赌注如何分配？ 

命题 10-14 关于骰子问题，从略. 

惠更斯给这些命题一一证明.重要的是在命题3中给出了分 
布 



a b 


p q 

p + q p + q 


的数学期望 


pa + qb 

[I =- 

P + Q 

正是现代离散型数学期望的定义，不过在荷兰文版中仍称“值，，. 

对于点数问题，惠更斯认识到与已胜局数无关，而与离全胜所 
差的局数 a ， &相关，而至多再进行的局数为 a + & - 1，对 e ( a ，&) 的 
求法惠更斯与帕斯卡基本一样. 

惠更斯的书一出版就立即得到学术界的认可与重视.在欧洲 
作为概率论的标准教材长达50年之久.而帕斯卡与费马的通信是 
1679年才发表的，因而惠更斯对早期概率论发展的贡献可与帕斯 
卡及费马并列. 
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六、 雅科布•伯努利的贡献 

雅科布_伯努利 （1654 - 1705) 在他死后由子侄整理出版的 
《猜度术》一书中，第一部分即为惠更斯《论赌博中的计算》的重 
印与评注，篇幅增到5倍，可见下的功夫之深. 

在关于点数问题中，他评注说“在计算分配额时，只要注意即 
将进行的比赛，不要管已经完成的比赛情况作为补充,伯努利建 
立了一组提供二个赌徒的机会值和在各种条件下二个赌徒之间赌 
注分配率的曲线. 

最重要的是他导出了对一般 P 的二项分布公式 

q = 1 — p 

而二项分布是帕斯卡解与惠更斯解的主要组成部分，这时已突破 
以等可能性为特征的古典概型，适用于赌徒机会不等的情形. 

七、 蒙特莫特的贡献 

蒙特莫特 （ Montmort , 1678—1719) 是法国的数学家，与伯努 
利家族有联系，他在概率论方面的著作 《Essay d ’ Analyse sur les 
Jeux de Hazard 》 （简称《随笔》）第一版于1708年在巴黎出版，该 
书介绍了伯努利《猜度术》的概要.在该书的第三部分详细地讨 
论了帕斯卡与费马的通信，特别是重新演算了 1654年8月24曰 
帕斯卡信中的全部题目，也详细讨论了三人场合的分赌注问题. 

该书出版后，蒙特莫特送一本给约翰 • 伯努利，并收到日期为 
1710年3月17日的回信，在信中约翰指出点数问题对任意 p 值 
的解可由 (p + g )^ 6 - 1 的展开式得到，即 

_) = (Hv 一 4 ⑹ 

i=a \ ’ 

显然这是分赌注问题正确解的普遍表达式，它通过把 （3) 中的 
用代入而得到 • 
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顺带指出，同样的解被棣莫弗独立得到，见1711年论文,该文 
后扩充为《机会学说》 (1718). 

《随笔》的第二版于1713年出版，蒙特莫特在点数问题部分 
加了三页，他首先介绍约翰的解答，其次他用二项式导出这个问题 
的解的一个新公式 

e (M) = E( a Hv ⑺ 

i=0 \ 〆 


这正是分赌注问题的另一个正确解的普遍表达式，它通过把 
(5) 中的用代人而 得到. 


蒙特莫特的思路是：在 n 次试验中成功 cz 次的概率是 


Qp 0 ?- 0 , 可知要在第 n +1次试验中完成第 a 次成功的概率是 


n+1 >v +1_a 


_O a= 



⑻ 


对 n + l = a + i，i = 0， l ， …， &-1 求和即得 （7) 式. 

蒙特莫特并指出在 （7) 中乘#以 (g + p ) 6 - 1 -, 再把二项式展 
开经运算后可得到 （6), 从而证明了上述两个解相等. 

关于蒙特莫特的上述思路解释如下 ： （8) 的第一式表示 A 到第 
n +1 次试验已胜 a 次; 第二式表示4在第 n 次试验就达到胜 a 次， 
而第 n + 1次试验 失败; 第三式表示 A 到第 n 次试验共胜 a — 1次 
而第 n + 1 次试验又胜.概率等式 （8) 的成立不管从事件分析,或者 
利用组合基本等式都可证明 . 4要最终贏得赌金必须 n + 1 = a + t 
而 i = 0,1， • • • ，6 - 1， 因此对其求和.最右一式即为 （7)， 表示在第 
a + i 次试验中4正好完成胜 a 次. 

最后顺带提及，在这本书中还刊载了尼古拉 • 伯努利 (Nicola 
Bernoulli , 1687—1759) 的一封信，在该信中已提出后来以“圣彼得 
堡悖论”闻名的问题.参看教学札记之二十“圣彼得堡悖论与期望 
效用函数”. 
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八、分赌注问题的一般形式解 

现代形式的分赌注问题之解是在伯努利概型中对任意 P 
(0 < p < 1) 给出的，在《概率论基础》第二章§3中已作完整 
的介绍.一种思路是沿着费马指引的设想赌到 n + m - 1局，必能 
结束，这时利用二项分布求甲胜 n,n + !•，••• ,n + m - 1局的概率， 
此即为甲最终取胜的概率 （2.3.15), 相当于本文中的⑹，因彼时乙 
达不到取胜 m 局. 

另一思路是利用帕斯卡分布计算首次达到 r 次成功.这时有 
两种具体方式 .• 其一考虑当甲再胜 n 局时乙的情况，若乙的胜局为 
0， l ,...， m - l ， 则甲已最终取胜，这就是 （2.3.13) 所表达的，相当 
于本文中的 （7); 其二是考虑当乙再胜 m 局时甲的情况，若此时甲 
已胜 n,n + l ，〃.， 则甲早已捷足先登，最终取胜拿走全部赌金，就 
表示为 (2.3.14) 的无穷 级数. 

三个答案表面看来羞别甚大，假如不能证明它们是相等的，那 
么分赌注问题就不算解决.幸而经过繁复的计算，我们已证明它们 
的确相等，见习题 *29 题的解答,这样我们也最终证实帕斯卡 的话: 
“无论在图卢兹还是在巴黎,真理是唯一的 


教学札记之 H 


随机游动三题 

随机游动是概率论中研究的第一个随机过程，它可以作为许多 
物理现象或社会现象的动态模型，在理论上与应用中都十分重要. 
下面只关心与《概率论基础》比较有关的三件事 • 

一、赌徒输光问题的一点历史注记 

《概率论基础》中提到随机游动溯源于赌徒输光问题.这一 
事实是公认的，但各书讲法详略不一且颇有分歧,现追索原始资料, 
简介于下： 

1655年荷兰数学家惠更斯访问巴黎，听其他数学家讲到了帕 
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斯卡和费马的新研究，印象很深，不过并不知道他们的解法.年底 
回国后便独自研究这些问题并于1657年出版了《论赌博中的计 
算》.这本书包括一篇简短的序言和14个命题.在这些命题及其 
解答中惠更斯明确提出了数学期望的定义,建立了概率的加法公式 
与乘法公式.在结尾时又不加运算的将5个问题推荐给读者，他对 
这些问题的解法发表于八年后的1665年. 

所谓“赌徒输光问题”是最后一题. 

问题5: 4和 B 各拿12块筹码并用三颗骰子赌，条件是 •.如 
果投得11点， A 就给 B —块 筹码； 如果投得14点， G 就给乂 一 
块筹码.谁先得到全部筹码的算赢.证明 A 与 S 取胜的机会之比 
为244 140 625比282 429 536 481. 

可以看出惠更斯的确十分明确地提出了赌徒输光问题.至于它 

的解答可以这样 考虑: 投三颗均匀骰子得11点的概率为投得 

216 

14点的概率是因此义胜一块筹码的概率 p = -^― = A , 
而 S 胜一块筹码的概率为 g = 他们分别有赌本 

15 + 27 14 

a = I 2 及& = I 2 .可以通过《概率论基础》 (2.3.19) 式求得 A 贏的 
概率％，通过 （2.3.21) 求得 B 赢的概率 p a ， 不过当时的通行术语 

是求>1与 B 取胜的机会之比即 n 当 a = &时，该比为 ( E )' 

而问题5的正确答案应为5 12 比9 12 ,这与问题5所求证的二数之 
比完全一致，可见惠更斯已完全掌握该类问题的正确解法.但是正 
如雅科布 • 伯努利所正确批评的，惠更斯太关心解决数值问题而 
不用代数符号讨论一般形式的问题，而后者有可能获得一般规律. 
不过惠更斯的书在19世纪之前还一直是学习概率论的重要教材， 
影响很大. 


1713 年雅科布 • 伯努利的名著《猜度术》在他逝世 8 年之后 
出版.该书共分 4 个部分.在第一部分重印了惠更斯的上述著作， 
并附上对其中大部分命题的评注.标题为“一篇关于惠更斯的机会 
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博弈可能性计算的论文，附雅科布 • 伯努利的评注”的论文，篇幅 
竟达原著之五倍，可见惠更斯对他的深刻影响以及他对惠更斯的 
敬重.该书对于赌徒输光问题首次给出了一般性公式.当然这本书 
最大的贡献是在最后部分证明了现在称之为伯努利大数定律的重 
要结果，开创了概率论发展的-个新阶段.伯努利的书后来也成为 
标准概率论教材. 


二、随机游动的常返性 

近代研究更关心随机游动的极限行为，最基本的问题之一是从 
原点出发随机游动的质点是否一定会再回到原点来. 

若以 pj ? 表示从原点岀发的质点，经过 n 步游动又回到原点 
的概率，当 

XIpo? = +°0 

n=l 


时，称随机游动是常返的. 

1. 直线上无限制随机游动 

在《概率论基础》第二章§3中对直线上无限制随机游动已 

导出 


Poo = 



71 / 2/c 

n = 2k + 1 


利用斯特林公式 fc ! 〜^有 


(2fc)! 

ldk\ 


( pq ) 


k 


(4pgy 


Vkn 


由于 pg = p(l - p ) < j ， 等式仅当 


2 


时成立.因此当 


p / g 时， 


( n ) 


y^ppo 
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而当 p = g 时， 



结论是直线上只有对称随机游动是常返的. 

2 . 平面上的随机游动 

平面上的非对称随机游动更是非常返的，因此我们只讨论对 
称的情况.《概率论基础》第二章§3例6已算出 

必 )=(『( 2 :) 2 

由斯特林公式 

[Gr( 2 :)r 〜忐 

因此 

以 )4[( 於 2 :)] 2 〜 以， 

所以平面上对称随机游动还是常返的. 

3. d 维空间格子点上的对称随机游动 

这时 P & n ) 〜^ 因此当^ 3时， 

OO OC - 

!> 益 ) 〜 E# <oc 

n=l n=l 

这样一来我们惊奇地发现，即使是对称的随机游动，在三维及三维 
以上的空间，都是非常返的.波利亚在1921年首先发现这些结果， 
1940年有人算出3维空间中作对称随机游动的质点返回的概率仅 
为 0.35. 

三、随机游动逼近布朗运动 

随机游动描述直线上质点的运动，每单位时间只向右或向左移 
动一^小格. 
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这也可以看作是在极短间隔中对连续变化过程观察的记录.例 
如每隔 0.000 1秒观察一次某股票价格的涨落，这样的记录，连在 
一起就是一根连续的曲线.用等间隔观察逼近连续涨落在几乎所有 
的学科都是有用的方法.下面我们从随机游动模型出发，加上若干 
假定，导出一种最重要的随机 过程. 

以足记质点的第 i 次移动，它们相互独立，同服从如下 分布: 

P{Xi = - 1 } = P{Xi = 1 } = ^ 

因此 


EX{ — 0, DXi = 1 

假定质点每隔 At 移动一次，每次向左或向右移动一格，长度 
为 Arr ， 若质点于0时刻从0点出发，则它在*时刻的位置为 

= Ax(Xi+X 2 + + 

因此 W ⑼= 0,且 

EW(t) - 0, 1) 卿 )= (Arr) 2 [^] 

为使讨论有意义，对及 Ax 的取法必须细加研究，最后确定取 

Ax = c\/At 


这样一来,令 △< 一- 0, 可得 

EW{t) = 0, DW{t) —^c 2 t 

由于 W{t) 是独立同分布随机变量之和，其方差存在，由中心极限 
定理知 

W{t)^ N(Q,c 2 t) 

这样我们知道，在任何时刻描述质点位置的随机过程 W ⑷都 
服从正态分布. 

由随机游动的假定，可以知道 W(t) 在互不相交的时间区间的 
变化是相互独立的，即 W(t) 是独立增量过程，而且在⑺< + T ) 
中的变化只与时间区间长度 t 有关，即有平稳性（时齐性).总而 
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言之， W ( t ) 是时齐、独立增量过程，具有正态分布，这种随机过程 
称为布朗运动，它与具有时齐（平稳）独立增量泊松分布的泊松过 
程，是当代概率论研究中最重要的二类随机过程，扮演着基本粒子 
一样的角色. 

1827年英国植物学家布朗观察到浮游在水中的花粉进行着无 
规则的运动.为解释布朗运动，许多伟大的物理学家都进行了研究， 
直到1905年爱因斯坦才作出第一个与实验相符的说明，可以说关 
于布朗运动的研究对物理学的近代发展影响巨大. 

关于布朗运动数学模型的研究对概率论学科发展的影响甚至 
更大.首先1900年在庞加莱指导下，巴舍利耶 ( Bachelier , 1870— 
1946) 完成了他的博士论文“投机理论”，该文如今被誉为开创了 
“连续时间随机过程”与“连续时间金融学”两门学科.在经济金 
融界该文因太超前而被埋没近60年.在数学界该文虽未得到应 
有的评价，不过，后继的研究者还是大有人在.1918年维纳建立它 
的随机过程理论，指出该过程样本函数以概率1处处连续，处处不 
可微.因此布朗运动过程在概率界有个同等流行的名字 -一 维纳过 
程.之后对该过程研究做出较大贡献的有莱维和日本的伊藤清，特 
别是后者创立的 It 6 随机微积分，现在成了连续时间金融学的重要 
工具，致使最近20年来在概率统计界引起了一场金融热. 


教学札记之 


算术密度 


一、 算术密度 

“从正整数中随机地选取两数，求此两数互素的概率”，这是俄 
国数学家切比雪夫最先提出的问题.这个问题是对古典型概率的一 
大挑战.它试图保持等可能性而把概率的定义推广到自然数构成的 
无限样本空间/2 = {1，2,3，. - }. 

类似的想法在几何中曾出现过，以1665年牛顿的几何概率， 
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1763 年贝叶斯的台球桌模型和1777年蒲丰投针问题为代表，后来 
借助于几何体的测度（长度、面积、体积）建立了几何概率，取得了 
一 '定的 成功. 

现在的问题是从数论中关于既约分数而提出的. 

对于无限集合 A 要保证随机选取的等可能性，取个别数的 
概率只能为0,取预先指定的任何有限个数的概率也应为0.取 

得偶数呢？似乎应该是^取被3整除的数呢？似乎应该是 

…… • 一般地，取到能被 fc 整除的数（其全体即为 fc 的倍数说) 

的概率应为 

k 

为了使上述想法合理化，可以考虑有限样本空间12^ = {1， 

2,…， iV }， 对自然数集 A ， 定义 

rw >1 、 \Anf2N\ ，、 

Dn { A ) = —-— (1) 


其中表示集合 S 的计数. 

定义若 lim D n ( A ) 存在，记为 P ( A ), 称为数集 A 的算术 

N—kx> 

密度 • 


按此定义 


P ( E k ) = 


lim 

N—^oo 


Ek n 

N 


1 



( 2 ) 


与直观相符，而且取到个别数或预先指定的有限个数的概率都为 0. 
进一步由数论中的欧拉定理知道任取一数为素数的概率也为 0. 


仿筛法可知 

P(E 2 = \ + = 準 2 ) + P(E 3 ) - P(E 6 ) 


一般地，对 £； fcl ,说 2 成立加法公式 


P ( E kl U E kl ) = P ( E kl ) + P ( E k2 ) - P ( E klXk2 ) (3) 


可以发现素数有特殊性，若 Pl 与？ >2都是素数，则 

P(^PlXp 2 ) ^ P (五 !>1)P ( 五 P3) 
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这时尽 n X P2 = ^ P1 n £； P2 ，故成立 

P ( E Pl 叫 2 ) = P ( E P1 ) x P ( E P7 ) (4) 

因此五 P 1 与五 P2 “独立” • 

这也可以推广到 n 个素数 Pl ， P 2 , …， Pn 的 场合. 

一^般地，若 fcij A ：2, • • • , k m 互素，也有 
P ( E kl n 执 2 n • • • n £^ m ) = P ( E kl ) P(EQ … P ( E km ) (5) 

二、 可列可加性 

在概率论的公理化结构中，如 n 是离散样本空间，多可取为 
Q 的子集全体.在算术密度中却遇到了麻烦，因为上面已得到，对 
任何一个正整数 fc ， 作为单点集 { fc }, 应有 

P{{k}) = 0 . 

若概率 P 具有可列可加性，那么 

oo 

w) = E p _ = 0 

k=l 

这就与概率的规范性矛盾，而且这时任何集合的概率皆为0,还讨 
论什么？ 

因此在算术密度研究中，概率空间 （ A 多， P ) 的给定，要么放 
弃 P 的可列可加性，只保留有限可 加性； 要么保留 P 的可列可加 
性，把多加以限定. 

三、 有限场合 

数论中最基本的是可除性理论，这时多可以设为由有限个 
E kl ， E k 2 ，…氣 产生的道 

问题随机选取一正整数，求它不被5整除，只能被3整除同 
时又能被4或6整除的概率. 

这是见诸于钟开莱《初等概率论附随机过程》书中的一道例 
题，曾被国内若干教科书所沿用， 
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按题意，要求 E 3 E b ( E 4 UE 6 ), 容易证明它等价于五 2 五 3 瓦 5 ,因 


此 

P U 五 6)} = jP{£?2 五3五 5) 

= P { E 2 E 3 } - P { E 2 E 3 E 5 } (6) 

1 1 2 
= 6 ~ 30 "" 15 

这时多只由 E 2 ， E 3 ， E 4 ， E 5 ， E ^ 产生，只用到概率的有限可加 
性，整个解题过程是严格的， 

四、切比雪夫问题 

回到本文开头提到的切比雪夫问题上来，这就是《概率论基 

础》的习题二 "50 题，不过出示了答案改成证明题. 

其解题思 路是： 若以记取出的第一个数能被 p 整除，则 

P { A V ) = 1，以 B p 记取出的第二个数能被 p 整除，则 P ( B p ) - 
V V 

以 C 记两数互素，则 

C ^ f ]( A ^) (7) 

押数 

即所取两数不能同时被某个素数整除. 

利用前述素数的特殊性 （5) 及>^与的独立性 

酬= n p (硕） 

素数 

= H I 1 - p ( a p b p )] 

数 

= IJ [1 一 P ( A p ) P ( B p )] (8) 

p 索数 

=n(4) 

pit 数 y 

1 _ 6 
"02) 
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详细的解法参看习题解答部分.这种问题通常都会碰上黎曼 < 函 

数 C ( s )， 这里 S = 2,用 C (2) = ^得到答案. 

o 

这个解答过程中实际上利用了概率的可列可加性，因此不能 
算作完全严格.不过这个问题可用数论方法严格处理.参看维诺格 
拉陀夫《数论基础》第二章问题 21. 


五、欧拉函数的统计学 

欧拉函数 ip ( n ) 是数论中重要的函数，有众多应用，本身也很 
有趣. 

定义 欧拉函数 ( p ( n ) 定义为不超过 n 且与 n 互素的正整数 
的个数. 

例如 

W ⑴=丄， P ⑺= i，P ⑶= 2，咖)= 2，#⑻= 4， 

P ⑹= 2， （/? ⑺= 6， #(8) = 4， #⑼= 6， (/?(10) = 4 


一般地，对素数 p ， 

^{p) =P_h ^P(P Q ) =P a - P a ~ X 
若 n 的标准分解式为 


则 


n = pVP2 2 - f Pk k 
= Tt(l - ) f 1 - ) • • • (1 - ) 

\ Pi 八 P2 / V p k J 


欧拉函数 ip ( n ) 有一个重要的性质. 

性质 （欧拉函数的可乘 性)： 若 m 与 n 互素，则 

( p ( mn ) = ( f ( m )( p { n ) 


⑼ 



( 11 ) 


这性质显然可推广到多个互素数的场合. 
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若引入函数 p p ( n ) 如下: 



V I n 
P\n 


( 12 ) 


这里 p I n 表示 p 可整除 n ， 而则表示 p 不能整除 n . 

若以 q 记 0 或 1, 则 

^{PpiH iPpM = e k } 

= p {Ppi (n) =ei} ••- P{p Pk {n) = e k } 

这是以前讲过的，任选一数 n 能否被素数 Pl ，…，外整除是相互独 
立的，即 （ 5) 的特例 • 因此 （ 13) 式表明 p Pl (n )， … ， p Pk (n) 是相互 
独立的. 

利用新记号 

¥=n(i - 亨） ㈣ 

v y 

这里 p 跑遍一切小于 n 的素数. 

对于任意定义在正整数上的函数 f(n )， 定义 f(n) 的均值 

1 N 

^{fH} = ^ 51 伽） （ 15 ) 

n=l 


只要极限存在. 


算术密度的定义可以看作它的特例. 
由 （13) 式可得 


p^p/e p^pk 

= Hi 1 - 
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它提示 


甲 ) } 

p 

PpH 


nW^-T)} 

nO-^) = 


6 


02 ) 


这里还是遇到可列可加性的困难，不算严格推导.不过，它也可以 
严格处理，而且还有更深入的研究，见 Kac 书. 
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第三章随机变量与分布函数 



从本章起变换语言，用随机变量描述事件，以分布函数给出概 
率,从而使概率论与其他数学学科对接，内容的展开明显加快.主 
角换成分布函数. 

在上章§4的应用实例中出现的 p 就是随机变量，可见随机变 
量概念是十分自然的.事实上，在19世纪中叶之后随机变量概念 
出现，随后即被广泛采用就使概率论进人现代形式. 

陆续介绍了一些分布函数，有些是老相识，有些是新面孔.最 
重要的分布 一 正态分布终于登场，此后一直扮演主角，而均匀分 
布则为几何概率提供精确的数学语言. 

从一维到多维，从变量到函数，研究内容大为丰富. 



§3.1 随机变置及其分布 

用随机变量来描述随机现象是当代概率统计的通用做法，概 
念直观，方法自然，与数学其他分支容易建立联系，有助于概率论 
成为数学大家庭中的一员. 

从此之后，事件一般都通过随机变量的某一个关系式表出，而 
概率则用分布函数计算. 
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在公理化体系中，随机变量 6(0；) 定义为样本空间0到欧几 
里得空间 R 1 的可测映照，其随机性由 U ； 表出，在试验前不知哪一 
个 a ; 将出现，“变量”二字表明试验的结果用一个实数表示，把概 
率论问题“数值化”，而可测性 { o ； : eB } e ^ 则为分布函数 
F ( x ) = P {^ < x } 的定义铺平道路.在习题 M 9, *50 中证明可测性 
也能用表面更宽的条件 { a ; 1( a ;) < x } E ^ 代替,这实质上已是测 
度论内容，并不要求本书读者必须掌握，但有兴趣的读者不妨阅读 
教学札记之十九“概率论公理化结构与测度论”，增加了解. 

随机变量依取值的不同分成离散型与连续型，前者用概率分 
布或分布列描述，后者用密度函数描述，分布函数统一了二者. 

分布函数是非降、取值 [0,1] 的左连续函数，它完整描述了随 
机变量，又便于处理，因此成为今后研究的主要对象. 

概率论中最有名的分布集中在本节出现.其中离散型的已在 
上面两章亮过相，而连续型的则属首次登场，尤以正态分布和均匀 
分布最为重要. 

《概率论基础》特意安排让离散型等待时间分布：几何分布， 
帕斯卡分布，负二项分布与连续型等待时间分布：指数分布，埃尔 
朗分布， r 分布对称出场.前者在第二章通过伯努利试验引入，后 
者则经由泊松过程在本章导出.这两列分布性质上的相似性实非偶 
然，因为泊松过程可由伯努利试验逼近.与此有关的内容以后多次 
在正文与习题出现，也可参看教学札记之十二“关于两个等待时间 
分布序列”. 

正态分布是概率论中最重要的分布，在全书的黄金分割时段首 
次出现，以后章节还将对它作深入讨论.读者在这个阶段可主要练 
习它的有关计算.若手边没有正态分布表 ， Shah (1985) 推荐的如下 
近似公式可达很高 精度： 

^( z ) = ^ + l + e 7 0 < z ^ 2.2, |£| < 0.005 

丄 LI 

示性函数连接了事件与随机变量，使上两章的许多结果可转 
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换成随机变量的结论. 

勒贝格分解中的奇异型分布最重要的例子来自康托尔奇异函 
数，参阅教学札记之二十七 u [0, l ] 中数的 g 进制展开与概率论”. 

§ 3.2 随机向置，随机 变量的 独立性 

随机向量即多维随机变量，对它的研究不但涉及每个分量自 
身（边际分布)，更要考察它们之间的全部关系（联合分布函数)，因 
此条件分布、独立性（几乎完全平行于事件场合）应需而生，大大 
丰富了研究的内容. 

联合分布函数以及它的两种特殊表现形式——多元概率分布 
与多元密度函数成为主要研究工具. 

有名的一元分布众多,但有名的多元分布则寥寥无几. 

在离散型场合，主要只有两种，它们是作为二项分布与超几何 
分布推广的多项分布与多元超几何分布.当摸球模型袋中的球从二 
色改成多色时作此推广.多项分布对应放回摸球，这种摸球方式中 
每次摸球结果独立同 分布； 多元超几何分布对应不放回摸球，这种 
摸球方式中每次摸球结果同分布（回忆抽签与顺序无关!）但不独 
立.认识放回与不放回摸球的差别在概率论中十分重要，因此在随 
机向量场合重又提起，《概率论基础》表 3.2.1 及表 3.2.2 给出简 
单实例，教学札记之十三“摸球与抽样”中作进一步概括.通过合 
并不同颜色球为一类（降低了问题的维数)，可得到边际分布的有 
关结果，这是处理这两种分布的重要技巧，参看习题三中23及24 
题. 

二元均勻分布可概括几何概率的大部分问题，到了这里总算可 
以把几何概率一节的各个例子的潜在假设完全弄清. 

二元正态扮演本节主角.它是应用最多的二元分布，且具有许 
多特殊的性质.本节引进的典型分解法使讨论大为简便.特别值得 
指出的是条件分布仍为正态，且其均值 H — ^2 + p —{^ - #1) 是工 

的线性函数，方差 4(1 - 〆 ）是常数，与 Z 无关，这个性质在应用 
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中十分重要，图 3-1 有助于理解这一结论. 



髙斯用最大似然法导出正态分布是对概率论的重大贡献.《概 
率论基础》的推导因利用柯西方程，比原法略微初等. 

关于正态分布的其他刻画可参看教学札记之十四“正态分布 
的两种刻画”. 

§3.3 随机变量的函数及其分布 

本节讲清了在什么情况下随机变量的函数还是随机变量，并 
给出了计算它们的分布的各种方法.这是概率论通向应用（特别是 
数理统计）的重要路口，也是对学生们进行训练的重要操场. 

总的说，求分布问题，对离散型易,对连续型难.因此本节由连 
续型唱主角. 

本节布局以方法为主,以分布为辅.求随机变量函数分布的方 
法是本节的主题,当然应占主位.但是在介绍这些方法时一定要举 
许多例子，这类例子俯拾即是，因此就给教科书编写者很大的选择 
余地 • 《概率论基础》利用这个机会选择典型题型，介绍各种分 
布，特别注意引人新分布以及揭示分布之间的联系，大致做到每道 
例题都有所指.请读者在全节读完后复核. 

题材的展开以三个类型（一对一，多对一,多对多）对两种方法 
(直接法，变换法）交叉的方式进行，以公式、例题或专题的形式给 
出，概要列于下表： 
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直接法 

变换法 

V - 9(0 

例 1 —例 4 
均匀分布特殊性 

例 5 


和的公式与商的公式 
极小值一极大值 

增补变量法：例 8 

m = 


例 6— 例 10 

V 2 = 仰（《1，&) 




在一对一场合，两种方法几乎等价，在变换法适用的单调或分 
段单调的情形，用直接法还更具直观，因此这种场合还是直接法用 
得多 • 

在多对一场合,初看使用变换法是不可能的，因此只能用直接 
法.但是可以采用增补变量化为多对多，还是可以使用变换法.而 
且由于增补的变量可以按需要选择（见例 8) 或选择最简单的变量， 
所以进行起来还颇为方便.事实上，直接法的和、差、积、商的公式 
都可以用增补变量法方便导岀，读者不妨以此作为练习题，以加深 
理解. 

在多对多场合，直接法不易确定积分区域,多重积分计算也过 
于艰难，这时多数采用变换法. 

学习本节，单看不行，要亲自动手，这也是考验微积分水平的 
大好场所.习题三25题之后的习题大都是精选的求随机变量函数 
分布的典型题.教学札记之二十六“统计学三大分布的推导”介绍 
了统计学三大分布的各种推导法，对理解本节内容或有助益. 

通过本节课文及习题至少引入对数正态,柯西，瑞利， X 2 , *， 兄 
拉普拉斯，韦布尔，麦克斯韦，0等十个新分布，也提供大量关于分 
布之间联系的信息，请同学们自己总结一下. 




1. 直线上有一质点，每经一个单位时间，它分别以概率 P 及9 
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向右或向左移动一格，若该质点在时刻0从原点出发，而且每次移 
动是相互独立的，试用随机变量来描述这质点的运动（以&表示 
时刻 n 时质点的位置). 

解以表示时刻 n 时质点的位置，则若在时刻 n 该质点 
向右移动了 fc 次，必向左移动 n - A : 次，因此的概率分布为 


P { S n = 2 ifc - n } 


/O' 一、 卜 0 , 1 ， 2 ，… 

、0 ，其他 



【评注】对比第二章 §3 关于无限制随机游动的讨论. 

2. 设《为伯努利试验中第一个游程（连续的成功或失败）的 
长，试求$的概率分布. 

提示： 几何分布描述了连续的失败次数. 

答 尸 {《 p k q + q k p , fc = 1，2,3, … • 

【评注】在统计中，游程用于检验某类现象的随机性. 

3. C 应取何值才能使下列数列成为概率 分布： 

(1) Pk = = 1，2,…， AT ; 

(2) pk — Ar = l ， 2, …， A > 0. 

提示： 记住概率分布的充要条件. 

答⑴ (7 = 1; ⑵ (7=( e A - l ) 一 1 • 

【评注】 （1) 这个分布常称为离散均匀 分布 • 

(2) 若 《〜 jP ( A )， 则外；= jP{ 《 = fc K > 0 }， fc = 1，2,… • 

本题提醒大家，对离散型概率分布瓜，应注意 fc 的取值范围， 
最好养成良好习惯，在书写概率分布时，同时写明取值范围. 

4. 若分布函数定义为 F ( x ) = P {^ ^ x } y 试证这时的 F ⑷具 
有下列性质： 

( i ) 非降；⑼ F (- oc ) = 0, F (+ oo ) = 1; ( iii ) 右连续 • 

提示： 逐句逐字模仿课文进行证明，但要特别注意在哪些地方 
必须做出更改. 
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【评注】分布函数的另一种常见定义.阅读概率论书刊时必须 

注意. 

本题设置目的 有二. 第一，指出有另一种稍微不同的定义存在, 
使用或阅读时当加以 注意； 第二，抄一遍证明，明白为什么有左连 
续与右连续的区别，以后计算离散型概率时自会当心. 

5. 若 C 〜 "(0, 1)，试求常数 a , 6, c 使⑴ a - P{C ^ 1.645}; 
(2) P {| C | < b } = 95%; (3) P{|C — c | > c } = 0.51. 

提示：直接利用《概率论基础》附录三标准正态分布函数的 
数值表. 

答 （1) 0.05; (2) 1.96; (3) 1.165. 

【评注】正态分布计算训练 之一： 查表， 

6. 妊娠天数《的分布函数为#(270,100)，求《落在下列范围 
的概率：⑴ (260,280); (2) 短于250天；⑶长于300天. 

提示：先化为标准正态分布后查《概率论基础》附录三. 

答 （1) 0.682 69; (2) 0.022 75; (3) 0.001 35. 

【评注】正态分布计算训练之二：化为标准正态分布. 

7•若€的分布函数为 7 V (60,9)， 求分点:心， x 3 , a : 4 , 使（落 
在 (-00,Xi), (Xl,X 2 ), (x 2 ,x 3 ), ( ： T3,X4) ， (x 4 ,+CX)) 中的概率之比为 
7 : 24 ： 38 : 24 : 7. 


提示：对标准正态分布找满足所给概率比的分点 Zi , Z 2 yZ 3, Z 4 j 

再转换成 工1 ’工2，工3，工4 • 

答 xi = 55.5, X2 — 58.5, xs = 61.5, X4 — 64.5. 


【评注】正态分布计算训练 之三： 化标准，倒查表. 

*8. 在帕斯卡分布二中， 令 kAt = t，p = AAt ， 试 


证当 At — 0时，它能用 


e~ At - At 来逼近.(这可以解释 


为第 r 次成功发生在 （ t ，t + At ) 中的概率,其密度函数正好是参 
数为 r 的埃尔朗分布.用这种方法可以把课文中的对比严格化 .） 
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证明帕斯卡分布 
/k — 1\ ^ 


l ) p ? 


- ( 卜他 - 二 ！ 1 + ^X^Atyil - 入 At 广 r 

〔r 一 JJ! 

At- (^t-^).-.(kAt~(r-l)At)y , 

(r 一 1)!(1 一入 △*) V } 

At . 

(r -1)1(1 -AAt) V 1 


lim (l — AAi) 

At—o v 7 


忐 = e -At 


因此对固定 r ， 




輕一 1 「 
" F-ijT 


所以 

C ： O pV ' r = lS e '"- At+o(At) 

于是，当 At 4 0 时，帕斯卡分布 (^ lj ) pV - r 能用 

X ^ X ~ e- At • At 来逼近 . 

{r - 1)! 

【评注】第五章 §2 还会回到这个问题. 

9. 在生存分析中，作为研究对象的是非负随机变量，它们的分 
布称为寿命分布.若 C 是非负随机变量，其分布函数为 F ( x ), 密度 
函数为 f ( x )， 这时通常还引入生存函数 5( or ) = PU ^ X ]及失效 

率函数 A ( x )= r . 试导出 S ( x ), A ( x ), F ⑷及 f ( x ) 之间的 

I — Jr yx ) 
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关系式，并以指数分布验证之 . 


解 


S(x) = 1 - F{x) 


S(x) 




m dt 




S\x) = 一 /(X) 


A(x) 


/⑷ 


F ( x ) 

x S ， {t) 


S\x) ^ S\x) 
S(x) S(x) 


一入⑷ 


dt 


»x 




X(t) dt 


lo 5 ⑷ 

X 

ln5(ar) = - f X(t) dt 


••• S(x) = e 


J: 入 W dt 


F(x) = 1 一 S{x) = 1 一 e 


/ 0 X m dt 


f(x) = F\x) = \(x) exp 
对指数分布 Exp (A )， 

f(x) = Ae _ 


一 A(f) di 
Jo 


■Ax 


F{x) = 1 一 e - 


-Ax 


S{x) = e' 


-Ax 


A(x) = A 

【评注】在生存分析，可靠性等学科中，这几个是标准术语. 
顺便指出，失效率函数为常数是指数分布的刻画性性质，有人 
据此对指数分布的常见性提出“浴盆模型”作为解释.生物体的死 
亡或元器件的失效大都发生在早期或晚期.有先天性缺陷者早期就 
出问题，之后进入一个平稳期，到了晚期因老化又纷纷出毛病，所 
以失效率函数先有一段快速下降，再有一长段持平，最后又快速上 
升，形如浴盆，论者认为，指数分布描述了中间持平的一段.电话通 
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话时间也如是，因此排队论中假设服务时间为指数分布导出的公 
式在实际应用中效果良好. 

10. 设随机变量 c 取值于 [0, 1}^ P { x ^^< y ) 只与长度 
y - x 有关（对一切0 < :r 彡 y 彡1)，试证《 服从[0, 1] 均匀 分布. 

证 记 P{x < y ] = f(y - x ), 则对 a: = 0, Vy € [0,1]，有 

P{o^^<y} = f{y) 

对 Vyi, 2/2 e [0,1], yi < y 2 , 

P{0 < ^ < yi +^ 2 } = P{0 < C < yi} + P{y\ <yi+V 2 } 
即有 

f{yi + V2) == f{yi) + fM 
故 


f(y) = Cy 

由 /(l) = /(l 一 0) = P{0 彡 e < 1} = 1 推得 <7=1，所以 f { x ) = X, 
即 


P{o 彡 《 < x} = a ：， x e [ 0, i] 

因而 《服从 [ o , i ] 均匀分布. 

【评注】联系几何概率，刻画均匀 分布. 

•11. 若存在 e 上的实值函数 Q(0) 及 D (0) 以及 T ⑷及 S(x), 
使 

fe ( x ) = exp { Q (0) T ( x ) + D (9) + S ( x )} 

则称 {/❼， 0 e 0} 是一个 单参数的指数族_ 证明 （1) 正态分布 
iV ( m 0 ， a 2 )， 已知 m 。， 关于参数 cr ; ⑵正态分布 iV ( m , ag ), 已知 cr 0 , 
关于参数 m ; ⑶泊松分布 P ( A ) 关于 A 是一个单参数的指 数族. 

但是[0, 0】上均匀分布，关于0不是一个单参数的指 数族. 
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证 （1) 该正态分布密度函数 


fA x ) 


(x - m 0 ) : 


▲ exp { _ 

eXP {~2^ (x - mo)2 + ln ^；} 
exp I — ^j(x 一 mo) 2 — lncr — In V2k 



Q(^) = — ^(x) = (x —mo) 2 , D(cr) = — lncr, S(x) = — In y/2n^ 

则有 fa { x ) = exp ^ Q (( j ) T ( x )-\- D (( t )+ S ( x )^ 所以正态分布 N ( m 0 , 

a 2 ) 是单参数 cr 的指数族. 

(2), (3) 留给读者自证. 

指数族 fo { x ) > 0,均匀分布不满足. 

【评注】在数理统计中，一些重要理论结果是对指数族分布建 
立的.指数族分布范围甚广，你不妨自己再找几个. 

12. 定义二元函数 


F(x,y ) = 



x + y > 0 
x + y ^：0 


验证此函数对每个变元非降，左连续，且满足分布函数性质⑻，但 
无法使 （3.2.5) 保持非负. 

解易验证对每个变元非降，左连续，且满足分布函数性质 
( ii ). 

但若取 ai = a 2 = 0和 6 i = &2 = 1，则有 

■F*(l ， 1) — _F*(1 ， 0) — i^(0,1) + 0) = 1 — 1 — 1 + 0 = -1 

【评注】简单而重要的反例，配合正文. 

13•若 / i ( ar ), , 2 ( y ) 为分布密度，为使 f { x , y ) = fi ( x ) f 2 { y ) + 
h ( x ， y ) 成为密度函数， h [ x ， y ) 必须而且只须满足什么条件？ 
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提示： 利用分布密度函数的充要条件. 

答 h(x,y) ^ 一/ 〆 ：!；)/ 〆 ^/)且 JJ h(x 1 y)dxdy = 0. 

【评注】帮助记忆二元密度函数的充要 条件. 

14 .若 f\(x) y / 2 (a:), f3{x) 是对应于分布函数 FiOc )， F 2 {x), 
F 3 ( x ) 的密度函数，证明对于一切 a (- 1 < a < 1 )， 下列函数是密度 
函数， 且具有相同的边际密度函数 / i ( x ), f 2 (x), f 3 (x): 

/ a (工 1，$2,怎 3) 

= fi (xi) f2(x2) f3(x3) { l+a[ 2 Fi(xi) -1][2F 2 (x2)-1] [ 2 F 3 (x 3 )- 1 ]} 


解 首先， 

0 < Fi ( xi ) ^ 1 
一 1 < 2 Fi ( xi ) — 1 彡 1 

一 1 < [2^(x0 - 1 牌 2 (x 2 ) -1][2F 3 (X3) - 1]< 1 

代入 / a ( xi , X 2 , a ：3) 的表达式得 

/a (工 1， 怎 2， X 3 ) 彡 0 

其次 

f°° [2 巧 ㈤- l]fi(xi)dxi = f °° [2Fi(xi) - l]dFi( Xi ) 


•00 


00 


所以 


► c » r 00 roo 


[ F ?( x ,) - F ^)] 


/a (^1,^2? X3)dxidx 2 dx 3 


•00 


■00 


⑴ 


/ i ( xi)dxi / 2 ( x 2 ) dx 2 / 3 ( x 3 ) dx 3 = 1 ( 2 ) 


由 （1) ，⑵知 / a ( xa , x 2 , x 3 ) 是密度函数.用类似的方法计算可得边 
际密度函数为 


fa(xi,X2,x 3 )dx 2 dx 3 = / i ( xi ) 


00 
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/ a (Xi ， X 2 , 疋 3)dxida：3 = 12 (x 2 ) 



fa(xi,X2,Xz)dXidX2 = / 3 ( 怎 3 ) 


【评注】以一维密度函数为边际密度构造多元密度函数的方法 
之一 • 


15 .若 (^ ri ) 的联合概率分布为 



且 p {^V 7 ^ 0 } = 0 . 4 , P { t ] < 0 I ^ ^ 0 } = I ,试求： 

( 1 ) a , 6 , c 之值； 

( 2U 及 77 的边际概率 分布； 

( 3 )^ + r ? 的概率分布. 

解 (1) 由联合分布性质 a + 0.2+ 0.1+ 6 + 0.1 + 0_2 + c = 1 
得 a + 6 + c = 0 . 4 . 


由 P{^n _ 0 } = a + 0.2 + c = 0.4 得 & = 0 . 2 _ 


a + 6 = 0 . 3 , 推得 a = 0 . 1 , 进而有 c = 0 丄 


<x + 6 + 0.1 2 vq 

a + 6 + 0.3 = 侍 


( 2 ) 

€ 

-1 0 

1 

1 

-10 1 


P 

0.2 0.4 

0,4 

P 

0.3 0.4 0.3 


( 3 ) ^ + 7 ? 

_2 —1 0 1 2 

尸 1 

0.1 

0.1 0.4 0.3 0.1 


【评注】以一题而作列联表全般训练 • 
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16 . 若 (^r /) 的密度函数为 


P(A y ) 


Ae ~^ 2 x + y \ 

0, 


x > 0,2 / > 0 

其他 


试求：⑴常数 4 (2) P{^ < 2,r? < 1 }； (3U 的边际分布函数 ; 
(4) P{^ + r/<2};(5) p{x\y)- (6) P{e<2|r/<1}. 

提示： 独立，双指数分布，二元场合，用密度函数计算种种概 
率. 

答 （ 1) A = 2; (2) (3) 2e—' 工 > 0; 

⑷ （1 - e_ 2 ) 2 ; (5) 2e- 2x ，x > 0 ;⑹ 1 - e- 4 . 

【评注 i 以一题而作连续型的全部计算. 

17 •若 jP{" = m, = n} 


m 


(A P r(A-A P r— _ A 


m!(n — m)\ 
0,1 ， 2, • • • ， n，n = 0,1 ， 2, • • • ，试求： 


e 


⑴ P { v ^ n }\ 

(3) P{fi = m 1 1 / = n}; 

解 （ l) p{z/ = n} = 

m =0 

n 


(2) P{// = m}; 

(4) P{i/ - fi = k}. 
(Xp) m (X - \p) n 


•m 


E 〜 


m!(n — m)\ 
n! 


e 


A 


m—Q 


n\ m!(n — m)! 


P m (l-P) n ' 


-m 


n! 


e 


•A 


n = 0, 1’ 2, 


⑺ — 卜 E (A d gF 

n=m v / 

(A P r(A-Ap) fc _ x 


e 


- A 


E 

k =0 
. oo 

E 

k=0 

(AgT 

m ! 


rnlkl 


( x P r c - x A \^ p) k 


入 p) 


m ! 


e 


k \ 


入 p 


0 , 1 , 2 , 
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(3) P{/i = m | i /= n } = 


P{^ = =m, i/=n} 
p{i/ = n} 

( Ap) m (A - Ap ) n - m e~ A n ! 


(：) 


m\(n — m)! 


A n e~ A 


p m (l -p) n_m , m = 0,l,2, ••- ,n 


(4) P { i / - // = fc } = P{/i = j ， i / = fc + j } 

j=0 


XI= fc + = J> = fc + j} 

j=0 

y Xk+j e -A (, fc +■?；)!. (1 _ Xfc 

g ㈣ )! p ) 


oo 


E 


入 v _ 


e 


入 p 


— ( l - P ) fe A ^ A+Ap 

A :! ^ j \ 

= (A e_( A - Ap )，fc = 0,1 ， 2, ... 

【评注: M 艮有名的一个模型，习题二 43 题为其实例之一，后面 
还要再讨论. 

18. 设二维随机变量 ( e , r /) 的联合密度为 

1 


y ) 


.fci — 1 1 


x ,vl *e 


ifca-i y 


r(fci)r(fc 2 ) 

fci > 0, fc 2 > 0, 0 < x ^ y < oo . 试求 《与 7/ 的边际分布密 度. 
提示：求边际密度，注意积分限的选取. 

答《的边际分布密度 

，ki —1 


pd x ) 

v 的边际分布密度 


x r 


r(fci) 


e 


•X 


x > 0 


Pv ( y ) 


l 




r(fcx + k 2 ) 


y 


允 i+^2 — 1 ^—y 


y>o 
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【评注】当幻与 fc 2 为正整数时，€表示泊松过程中第 A ； i 个来 
到时刻， T ； 表示第 h + k 2 来到时刻，这就是本题的实际背景. 

*19 ■试证 p ( x , y ) = ^ e -(- 2 + 2< >^ 2 ) 为密度函数的充要条件 

为 a > 0, c > 0, b 2 - ac < 0, = ;y/ac 一 b 泛 . 

证 先证必要性.在积分 




p ( x , y ) dxdy = 





ac—b 2 2 

e a dxdy 


中，令 u = x + 土 j /， i ; = y , 解得 y = v , x = - t ;, 变换的雅可比 

a a 

行列式 I J | = 1. 如果 p ( x iy ) 是一个密度函数，则应有 

「oo _ 

du e a dv = 1 
J—oo 


p ( x , y ) dxdy 


*oo 



这意味着上述积分应收敛，因而必然要求 a > 0, ^^>0,由此 

a 

推得 ac - b 2 >0 以及 c > 0. 

由等式 f °° e _ at 2 dt =4 及 

J—oo y/d 



•oo 


l2 


—au 

K e du e 


a dv 


-oo 



\/3 T yfo ^ 
y/cL y/ac — l ! 1 



推得 K 从而证得必 要性. 

为证明充分性，必须证明在所列条件下， p ( x , y )^ 0 R 



p { x , y ) dxdy = 1 


前者是显然的，后者只要把上述证明步骤逆推，即可证得. 

[ 评 ■注 ] 事实 上 az 2 *f 2 bxy + cy 2 = y^j ^ , 条件 

0>0,0 0,00-& 2 >0，保证了矩阵(^ &> )是正定矩阵 • 
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在 K e _ Q (： c ’ y ) 中， Q { x , y ) 为正定二次型，才能构成密度，且必 


为正态分布. 

20 .⑴若 (^ v ) 的联合密度函数为 


/(^ y) 


{ 


4 xy ， 

0, 


0 < x ^ 1, 0 ^ y ^ 1 
其他 


问《与 T ? 是否相互独立？ 

( 2 )若 U ， r ?) 的联合密度函数为 


ff(x ^ )== lT 


其他 


问（与7/是否相互独立？ 

答⑴ M x ) = 2 x ， 0彡 x < 1， f v ( y ) = 2 y ， 0 < 2 / < 1，易知《 
与巧相互独立. 

(2) 兴(工）= 4a:(l - x 2 ), 0 < x 彡 1， grj(y) = 4y 3 ， 0彡 y < 1， 

g { x , y ) ^ 炎⑻％⑼，所以 C 与”不独立 • 

【评注】（ 2 )为反例之一（关于独立性的密度分 离). 表面上 
g { x , y ) 已写成分离形式，但问题出在取值范围上，请注意 p ( x , j /) = 
8x2 /因此独立性要求的分离（3. 2 . 2 5) 无法实现. 

21. 若《， r / 相互独立且皆以概率_取值+1及 - 1，令 C =犰 

试证 d 乂两两独立但不相互 独立. 

证 p{c -i}-pu = i^ = i}+p{e = -i,w = - 1} = • 

_ P {( = —1} = _ P {< = l ， r / = 一1} + 尸{( = 一 1 ，W = 1} ^ ^ 

P 仪 = 1,C = 1} = P{C = l,r/ = 1} = ^ = P{C = 1}P{C = 1} 

同理可得 


P{c = 1，< = - 1} = PU = 1}P{C — 1} 
P{ 《 = 一 1， c = 1} = = — 1}P{C = 1} 
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尸 U = — i，c = -1} = = -1} P{C = -1} 

故《与 c 相互独立. 

类似可证 V 与 (: 相互独立.即有《， T /， (：两两独立. 
但 

p {^ = 1，W = 1C = 1} = p {^ = l,r; = 1} = ^ 


P {^ i } P { v = i } P { C ^ i } = \ 

所以 C % c 不相互 独立. 

【评注】反例之二（关于两两独立与相互独立).两两独立不意 
味着相互独立，随机事件如此，随机变量也如此. 

两两独立而不相互独立之例，首推伯恩斯坦反例，已在《概率 
论基础》第二章§2介绍过. 

另一个有名的例 子是： 投硬币，乂表示第一次出正面， B 表示 
第二次出正面， C 表示两次同为正面或同为反面，则木 B ，(7 两两 
独立而不相互独立. 

还有一个常用的例子是：掷两颗骰子，4表示第一颗出奇数， 
B 表示第二颗出奇数， C 表示二颗之和为奇数，则洚 B ， C 两两独 
立而不相互独立. 


事实上，这三个例子都可以化为本习题，即它们是等价的. 
22.设(^)具有联合密度函数 


( 1 +叩 

P { x , y ) = < 4 

I 0 ， 


| x | < 1, \ y \ < 1 
其他 


试证 （与 7/ 不独立，但 C 2 与沪 是相互独 立的. 

证⑴ M x ) = k! < !. 9v(y) = M < 1 

因 C 与 r? 的联合密度函数不能分离变量，即 p(x,y) 不能写成为 
M^)9M 的形式，所以6 //不 独立. 
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(2) 对 (K u 彡 1， 

P {^ 2 < u } = J A ⑷ dx = J ^ dx = y/u 

x 2 <u x 2 <u 

同理对 0 彡 V < 1， 

P{r ) 2 < 1 ；} = y/v 

而对 0 彡 彡1， 

P{^ 2 < zx, ry 2 < i/} = JJ p(x, y) dxdy = y/uy/v 

x 2 <u 

y 2 <v 


因与 r / 2 的联合分布函数能写成边际分布乘积的形式，所以 P 
与 T / 2 相互独立. 

【评注】反例之三（关于随机变量函数的独立 性). 是否与定理 
3.3.2 矛盾？——不，因为《与7/不是 f 与 r / 2 的单值函数. 

23. 若每次试验中出现4 2 , 的概率分别为 Pl ， P 2 及 P 3, 
而且 P1 + P2 + P3 = 1,共进行 n 次独立试验，以 Ml ， M2, M3 分另 1 J 记 
A u A 2j A 3 出现的次数，试求： 

(1) 0/1， Zi 2) 的联合概率分布； 

(2) mi 的概率 分布； 


(3) P { fi 2 - k 2 \fii = ki }. 

答 ⑴ P{^i = ki,fi 2 = k 2 } 

= P {^1 = fcl ， M 2 = fc 2 ， P 3 = 打 一 左 1 一 如} 


n! 


Pi ' P^Ps 


—fcj —/C 2 


fci!fc2!(n — ki 一 知 2)! 
n—fci 

(2) P{/xi = k\} = [ P{^\ = fci ， 的 =h} 

A ：2=0 

⑶ P{fi 2 = fc 2 |/xi =ki}= k2 ^ 
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P{^\ = fcl ， /X2 = 灸 2，#3 = n — fcl — 左 2} 

P{/Xl = A ： i } 

_ nlp ^ p ^ p^ 1 ^ 2 fci !( n ~ fc !)! 

fci!fc 2 !(n 一 fci - fc# n!pj 1 (1 - pi) n_/ci 

=(n-fc x )! / p 2 \ k W p 3 y - fcl ' fc3 
k 2 \( n 一 友1 一 h )! \ P 2 + P 3 / \ P 2 + P 3 / 


【评注】以 r = 3为例讨论多项 分布. 模型：推广的伯努利试 
验（多色放回摸球模型 )； r = 2化为二项 分布； 边际分布仍为多项 
分布；条件分布仍为多项分布. 

24. 袋中装 i 号球况只 ， i = l ，2,3, 爪+爪+呢=斤，从中 
随机摸出 n 只，若以叫的，灼分别记1, 2, 3号球出现的次数，试 
求： 

(1) ( Mi ,/ x 2 ) 的联合概率 分布； 

(2) Ml 的概率 分布； 


(3) P {/ X 2 = ri 2 I /xi = ni }. 

答 

( 1 ) P{fii = ni,/x 2 = ri 2 }= 


dm) 

\n\ J \rt2 / \ n — ni — n2 / 


(：) 


n_ni 

(2) P{/ii =ni}=y^P{^i = ni ， /X2 =^ 2 }= 

na =0 



(3) P{/i 2 = n 2 t/ii = rii }= 

^ 4 ^ ri3 = n — ni — 712. 

【评注】与上題对照讨论 r = 3 的多元超几何分布•模型：多 
色不放回摸球模型； r = 2化为超几何 分布； 边际分布仍为多元超 
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几何分布；条件分布仍为多元超几何分布. 

以上两题虽对 r = 3命题，意在对任意 r (r ^ 3) 建立普遍结 
论.这样做的理由是避免繁复计算，节省做题时间. 

25. 若6与&是独立随机变量，且心〜〜 
B ( n 2 , p ), 试直接证明 


⑴ Ci +《 2 〜 B(ni + n 2 ， p ); 


⑵ P{^\ = fc | + C2 = n} = 



证⑴ k 

p { ii +6= fc>=yi p {^\ = j } p {^ 2 = 釦 一 j } 

j =0 

=E O 1 - p)ni ~ j ( k n -j) pk ~ j ^ - p) n3_fc+J 
= ( ni t n2 ) p *( 1- p) ni+n2 ~ k 


所以得证 Cl + ^ 2 〜 B { n \ + n 2 , p ); 


( 2 ) P {^\ — k \^ i +^2 = n } 


尸 {6 = Ki + 《2 = 打 } 


P{^i + 6 
k } P {^ 2 = n — fc } 

P{^\ + 《2 = n} 




n } 
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【评注】 （1) 讨论二项分布的一个重要性质——再生性.把一 
枚硬币投了 m 次之后再投 n 2 次，关心出现几次正面，答案很明 
显. 


(2) 条件分布的答案很有趣，居然是超几何分布. 

26. 若6与6是独立随机变量，均服从泊松分布，参数分别 
为 M 及 A 2 , 试直接 证明： 

(1) ^1 +6具有泊松分布，参数为 Ai + 入 2; 

(2) p{6= 叫 i+6=n}= 0fc^)G^) . 
证（证明留给读者） 

【评注】与上题对照，讨论泊松分布. 

(1) 再生性也成立，但没有上题 直观： 客车流加货车流还是泊 
松流？！ 


(2) 条件分布对应地变成二项 分布， 

27 .设^的密度函数为 p { x \ 求下列随机变量的分布密度函 
(1) 7 ] = $ -1 ； (2) 7j = tan^; (3) rj = |^|. 

提示： 用直接法或变换法均可. 


答（1)?(2/ -1 )?/一 2 , y /0; 



+ y 4 


p (nn: + arctan y ); 


(3) p (-y) +p(y)，y ^o. 

【评注】求连续型随机变量函数的 分布. 

中等难度，不止一种做法. 

28.设$与 r; 相互 独立且服从同一几何分布，令 （ = max(^,7/), 
试求⑴ ( C,0 的联合概率分布； （2) C 的概率分布； （3) 《关于 C 的 
条件概率分布. 


解设/^ = i} = q l - 1 p , i = 1， 2, …， 

(1) 当 i < fc，P{C = = P { r ) = = i} = P 2 q ^ k ~ 2 ； 
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k 


当 i = P{c - Ki = i } = y ^ P { r ? = = fc } = ^ _1 (1 - q k )\ 


当 i > fc , P{C = fc , ^ = i } = 0; 


k-l 


k 


( 2 ) p{c = fc } = XI= k )+Yl p ^ = 


^一 i 


EpV + W 、 i - 〆 ) 

i=l 

网卜％ -/- 1 一 /) 


(3) P {^ = tic = fc } 


P{^ = i,C = fc} 
—下 {C = fc } 


2 一妒- 1 一 y ， 

— i I — q k 

T - 0-1-0， l = k 

K 0, i > k 

【评注】求离散型随机变量函数的分布. 

29. 若 为相互独立的分别服从 [0,1] 均匀分布的随机变 
量，试求< W 的分布密度函数. 

解法一（卷积公式） 《与 r / 的密度函数为 


， 

pd x ) = Pv( x ) = * 


1，0彡 z 彡1 
0，其他 

由卷积公式 （3.3.20) 及独立性得 C = ^ + T 7 的分布密度函数为 


PC ⑷ 


pd ^ Pv ^-^ dt 



0< t$l 
O ^ x — t^l 


1 x 1 di = 



0^^ x ,0^ x^l 


dt 
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dt, 0 彡 x 彡 1 


o 


f 1 

dt , 1 彡 x 彡 2 

Jx - 

l 

,0, 

其他 

f 

0 < x < 1 

2- 

■ x ， 1 ^ x ^ 2 

o, 

其他 


解法二（几何方法）由图3_ 2 可 
知，若记 

F c ( z ) = P {^ + T ]< z }= JJ p ( x , y)dxdy 

： c + V <« 

则当时， K ⑷ =0; 

当 0< Z <1 时， F c ( 2 ；) = JJ dxdy = y 

0<x+v<2 

(即 AAOB 之面积)； 

当 1 < z 彡 2 时， 


iy 



图 3-2 


Fq (z) = jj dxdy = 1 一 — 2 之) . =_ 皆 + 2z 一 1 

0<x+y<z 

O^x^l 

O ^ y^l 


(即多边形 OCDEF 之面 积)； 

当 z >2 时， 巧⑷二 JJ =1 

O ^ x^l 

O ^ y^l 

于是， （ =《 + ” 的密度函数为 


p c (x)= < 


X ， 

2 — x ， 


0 , 


0 ^ X ^ 1 

1 < x ^ 2 

其他 
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【评注】解法一是卷积公式 (3.3.20) 的用法举例，该公式使用 
中的主要困难之一是确定积分上下限.几何方法则更直观，更简便， 
当然实质是一致的. 

这个分布称为三角形分布，亦称辛普森分布. 

辛普森 (1710—1761) 在数学中因数值计算而著名，对概率论 
主要贡献在误差理论，是概率论中最早研究连续分布的学者. 

30. 在（0, (0 线段上随机投掷两点，试求两点间距离的分布函 
数 • 

解设在 [0, a ] 内任意投掷两点，它们的坐标记为（6，&)，贝 1 J 
(6,《2)的联合密度函数为 

p(ti,t 2 ) = 

设两点距离为7/ = 16 - &|，其分布 
函数记为 F v ( xl 从图 3- 3可看出满足要 
求的为图中的阴影部分，故 

F^(x) = P{|6-6l<x} 

= JJ P (^^2) dtid < 2 

^X<t\—t2<X 
0<ti<a 
◦<t 2 <a 

0, 

a 2 — (a — x ) 2 

1, 

【评注】从解題的几何图示可明显看出本题与会面问题的联 
系. 

31 . 若 《与 ”相互独立,均服从参数为^的指数分布 Exp (^), 



图3-3 

0 < x < a 
x > a 



^ 2 , 0 ^ ti ^ a , 0 ^ t2 ^ ci 
a o ，其他 
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试证 c = € - r ? 服从拉普拉斯 分布: 

1 

p ( x ) = G e Q ， 

证 C 与 r ? 的密度函 数为： 


—oo < X < oc 


9 ⑴ 


e 


a 


a 


t >0 


记 C 的分布函数为 F ( x )= 尸仪 - r ? < x }, 贝 IJ 
当: r 〉 0 时，参看图 3-4 


F ( x ) 


t +oo rt2 - {-x 

)H 


tl + t 2 


r+oo 

0 ot 

.+oo 1 

0 oc 

+oo 


e 


e 




a 


a 2 


e 


e 


a 


dt\ 


a 


t 2+® 


d <2 


0 


e 


a 


d <2 


•1 

Jo 


e 


a 


e 


2t2~h~x 

a 




a 

+oo 


a 


dt 2 


+ -e 


2t 2 +x 

a 


0 


+oo 

0 


~2 e 


a 


x 


由此得，当 x >0 时的 C 的密度函数为 p ( rr ) = f e a ， x >0, 

2a 

当:时，参看图 3-5 

r+oo rt2-\-x i _ 


F ( x ) 




dt 2 

■x Jo 


a 2 


e 


a 


dti 


，+oo 


-X 


e 


a 


一 e 
a 

+oo 

—X 


a 


e 


2t2~hx -] 
a 


a 


d <2 




2 t 2 +X 

a 


+oo 


•X 
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于是 C 的密度函数在0时为 p ⑷ x ^ O . 



图3-4 



图 3 — 5 


所以得(：的密度函数为 

1 -學 

p(x) = — e 
2a 

【评注】拉普拉斯分布的出处 之一. 也可用差的公式（其推导 
类似于和的公式）计算.困难之一仍在积分限的确定. 

经验表明，使用和或差的公式求密度函数，最容易出错的是积 
分上下限的选定. 

32.若《与7?相互独立，分别服从 汊 (0,1)，试证0 =至服从 

V 

柯西分布. 

证 4的密度函数为 

厂 +oo 

p{x) = \z\(p(zx)(f(z) dz 

J—oo 


]zl V2^ e V2^ e dZ 
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r+OO 


2 


2 tc 


ze 


o 


(l-hx 2 )z 2 

2 


(l-hx 2 )z 2 


Jl 1 + X 2 


e 


d 之 
+oo 

0 


Jl 1 + X J 


【评 注】 柯西分布的出处 之一. 商的公式 （3.3.23) 的应用例子 • 
33. 若匕…， en 相互独立，且皆服从指数分布，参数分别 
为 Ai, A 2 , •• - , A nj 试求 r / = min (心，《 2 ,…， Cn ) 的分 布. 

解指数分布的密度函数 = Ae _ A ' x >0, 其分布函数 
为 F ( x ) = 1 — e a : > 0. 
rj 的分布函数为 


n 

F v( x ) = 1 - II l 1 - 巧 ⑷) =1 — 

i=l 


-(Ai + ---+A n )x 

e 


x > 0 


V 的密度函数： 

P^) = (A 1 + ..- + A n )e- (Al+ - +A " )l ,x>0 

即 r ? 服从参数为 Ax + -.- + A n 的指数分布. 

【评注】指数分布的重要性质之一.事实上与习题三 26 题关 
系密切，也见下题. 

34. 通称下列分布函数为韦布尔 分布： 


F ( x ) = 



1 - e - A ’， 
0 , 


x > 0 
x ^0 


这是韦布尔 ( Weibull ) 在研究金属材料的疲劳寿命中导出的，在可 
靠性研究中有广泛应用. 

若6,《 2 ,…，^相互独立，相同分布，并以 G 记它们的最小 
值 •（1) 当心〜 F ( x ) 时，试求 C ? 的分布函数； （2) 若 G 〜 F ( x )， 试 
导出&的分布函数. 
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链条的寿命取决于最弱环节，试说明上述概率结论的实际含 


提示： 回忆《概率论基础》中最小值公式 (3.3.26). 

答 （1)1 — e - nAx ' rr >0; 

(2) 1-e 一会 x>0. 

【评注】韦布尔分布亦是概率论中有名的分布，当形状参数 
a = 1时化为指数分布.它在可靠性研究中常用作寿命分布，理由 
之一可从如下实例中悟出 ：链条 的寿命与构成它的单环的疲劳寿命 
相关，若其一服从韦布尔分布，則另一个也是. 

35•若(^, T )) 服从二元正态分布，参数 / ii ，/ X 2, P , 以 

D ( X ) 记下面椭圆的 内部： 

- Mi) 2 2p(x-^i)(j/-/x 2 ) ( (y - M 2 ) 2 


( JiCT 2 


试求增水 D (入 )}• 
解所求概率为 


尸胸 e D ( X )} 


p ( x , y ) dxdj / 


(x,y)eD(X) 




2p(g-/ii)(y-/i 2 ) 


{- 


2(1 - P 2 ) 


( y — M 2) 2 

( XU ) 2 


2 jt ( Ti (72 \/l - p 2 


2 p(x - fn)(y - / i 2 ) 


0^(72 


(y - M 2) 2 

+ ~^l~ 

令 x = /ii 十 air cos 0 , y = / i2 + ( T 2 rsin 0, \ J \ — cria ^ r ， 

( 怎一鋅 1 ) 2 _ 2p(x-/i l )(y-/i 2 ) + (I /一 /i 2 ) 2 
o\ (710*2 (y\ 


dxdy 
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=r 2 cos 2 6 — 2pr 2 sin 9 cos 9 + r 2 sin 2 9 
=r^h{6) 


P{(M e D(X)} 


2jiaiCT2 y/l ;p 2 Jo Jo 

- 

2jt\/l — p 2 Jo Jo K 
2 jt Jo V / I 


2 n d e (^ e~^^r 


L — P 2 

丽 


r 2 h(0) 

2 T 1- P 1 ) 


de 

W) 


(, -2(T^) Wi-p 2 r 2n dd 

V 6 ) 2ji Jo h{6) 


八、 v/T^ r2n &Q 

— °°，得 ^兩 


P{(^rj)eD(A)}^l-e 


鄭一 70 


【评注】计算了二元正态分布在等概率椭圆内的分布值，也可 
以看作瑞利分布 （ 3.3.41) 的 推广， 或至少是另一种 推导. 

36. 若气体分子的速度是随机向量 K = (X,Y y Z ), 各分量相互 
独立，且均服从 N(0,a 2 ), 试证 S = x/X 2 + Y 2 + Z 2 服从麦克斯韦 

分布律： 

p(s) = \/I^ exp ( _ ^) ? s>0 

证 V(X, Y, Z ) 的概率密度为 


Pi ^ y . z ) 


1 — ^^■(/ 切 2 十名 2 ) 

[ y /2 n ) 3 ( T 3 
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S 的分布函数为 ： s > 0时， 

F(s) = P^X 2 + V 2 + < s} 



y/x 2 -hy 2 +Z 2 <S 


1 

[ y /2 n ) 3 a 3 


一^ ■( x2 *^ 2 + z2 ) 
e 


dxdrjdz 


令 ：r = p cos 6 sin y ^ psin^sin^, z = pcosp ， 贝 ! J 


r 27C r7l r3 

I d6 sin ^ d(p —- » 

)o Jo Jo (V^) <T 3 


e— 


2丌 • 2 


,o (\/2jt) cr 3 
对 s 求导，则得 S 的密度函数为 

p{s) = \/I5 exp 


x —^ p^p 


(- $)， 


s > 0 


【评注】 19 世纪后半叶，麦克斯韦开创的理想气体统计物理 
学从概率论借助工具极大地发展了物理学，反过来也大大地促进了 
概率论的发展. 

以上几题，我们趁机引进不少重要分布. 

•37 •若 K 2 , …， Cn 相互独立，均服从 iV (0， l )， 试用 (3.3.18) 
式, 化为 n 维极坐标,证明 r / = G +这+…+技服从 X 2 分布 • 

证对 a : > 0， 

F{x) = P{r) < x} 


d + … + 泛 < x } 


: I 'I 

f +--4- x^<x 


( 2 k ) 71 / 2 


exp 


{- 


x\ H - h x ； 

2 


dxi • - • dx n 
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作变换 


2^1 = psin 9i sin 0 2 - sin 9 n ^i 

^2 = P cos 6\ sin … sin 0 n -i 


工 n-i = pcos0 n _ 2 sin^ n _ 1 

X n = pcos 0 n —i 


此变换的雅可比行列式为 

谷 (Xi ，… ， x n ) 


P n ' l D ( e lr - ,6n-l) 


8{ p ， ❹ u ". ，沒 n - 1) 

其中 £>(&，•••，» n - l ) 只是〜，…， by 的函数，与 p 无关，于是 


F(x)= 




e 


(2 tt )-/2 J 0 

c n 


• rn rn p2n 

广 1 d P 0 • • 丄 J 。 D (设 1， • • ， 0 n -i)d<9 r • -dO n ^i 


2 ^n-1 


dp 


其中 C " = ^7^1 … l Jl 峰， … 人 -iJdUn -!. 再 
令户= V ^， 

1 广® —左 ii 1 

F(^) = ^ I dt 

2 Jo 

令 a : — + 00 ， 

1 r+oo _1 H — 】 

l = C n .if e 'di 
^ Jo 

1 r+oo n. 

=c n • - I e~ u u 2 2 2 du 

2 Jo 

斗 2 f ， G ) 
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故 c n 


n 

,2 


2 2 T 


(i) 


，于是得 r? 的分布函数 


F ( x ) 


•X 


t 

-r- 




n 

22ri 


e 


(1) Jo 

两边关于 a: 求导，就得 r? 的概率密度函数 

1 


2 t 2 l dt } x>0 




-§ §一1 

e 1 x l ， ： r > 0 


即 X 2 分布的密度函数. 

【评注】） C 2 分布是数理统计中最重要的分布，记住它是 n 个 
独立标准正态变量平方和的分布. 

35 题算 2 维积分， 36 题算 3 维积分， 37 题算 n 维积分，概率 
论学科（特别是数理统计）是使用高维积分最多的学科之一. 

38•若 《与 7/相互独立，且分别服从 r(n，A) 及 r(r 2 ,A), 试求 

a = ( + 与0= 的联合密度函数 q ( u , v ), 并证明： 

(1) 随机变量0服从分布： 

I \ 

P (^) 


由此得 


~ \ ，丄 ■ • ^ / 

r(n)r(r 2 ) 

v ri ^{l 

t OK 与独立. 

X 

x + y } v = 

x + y ' 


V 

d(u 、 v) 

X — i;- 


,则可推得 x = m;，y = w(l - 


—u 、 \ J \ = u 


于是得 


qM = y r ^ l e- Xy \J\ 


r(n) 


r(r 2 ) 
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入 ”1 竹 2 


r(n)r(r 2 ) 




l^-Xu 


u f A A W *(1 一 t;) 7 * 2 一 1 e、， w * Ti 


= • 為譜， H 1 


= Pc » P » 

可见， 0 服从 /3 分布，且 a 与 0 独立. 

【评注】变换法应用的 例子. 1•导出统计中重要的0分布，当 
r ! = r 2 = 1时化为均匀分布； 2.揭露了 r 分布的可 加性； 3.证明 a 
与/?独立.此外应注意本题与《概率论基础》第三章§3例7有 
明显关系. 

39. 若 tv 独立，且均服从 N (0, 1), 试求 [/ sp + Tj 2 与 V = & 

V 

的密度函数，并证明它们是独立的. 

解 S W = rr 2 +y 2 八 =^ 则 

V 



d{u^ v) 
d{x,y) 


2x 2y 
1 x 

y y 2 


=-2(^ + 1) 


l J 卜 2(1 

( U , V ) 的联合密度函数为 

g(u,t;) =p( a ： ,y)|J|r o0 <|^ 00 ) +?(*,2,)|7|(— <^ + °°) 

1 心 2 I 
= 2.^ e " 2 - , - 1 - 

2jc 2(1+ v 2 ) 

^ i -t i 

2 ji (1 + v 2 ) 

= p v (u)- p v (v) 
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于是可见， C/ ， V 是相互独立的，它们的密度函数分别为 

1 


Pv ( u ) 


2 


Pv (v) 


Jl(l + V 2 ) 


> 0 


,—oo < V < +0C 


【评注】1、变换法应用的例子.这时计算 JT - 1 较 方便. 另一 
注意要点是这里的变换是二对一，即 （ z ， y ) 与对应同一 

(WV); 

2-与《概率论基础》第三章§ 3例9关系密切，17, V 的独立 
性可预期； 

3. f ； =+ 7/ 2 〜 即 r ( l ， 也即 Exp (豆)； 

4. V = ^ 服从柯西分布，其推导又见《概率论基础》习题三 

V 

32题，且可通过上述例9与例5的定义式 (3.3.13) 导出. 

40•若 (^7?) 服从二元正态分布（3.2.22)，试找出 《 + 与卜7； 
相互独立的充要条件. 

解首先易得 €+ r ; 与 r ; 相互独立同 t / = 与 

V =《- Tyn + M 相互独立是等价的.再则令 
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其中 


= ■. “^7 exp O，* 1 C)} 



由此可得€ + 7；与 C - 7；相互独立的充要条件是 q = a 2 . 

【评注】若用下章将要讲的多元正态分布性质，本题有简明的 

解法 • 

41. 对二元正态密度函数 


p(x, y) = — exp I - - (2x 2 + y 2 + 2xy - 22x - 14y + 65)} 


(1) 把它化为标准形式 (3.2.22); (2) 指出 Ml ， / x 2 , w 2 , P; (3) 求 
Pi ⑷; (4) 求 p ( a :| y ). 

提示： 记住二元正态密度函数的性质，做到不经太多计算就能 
写出⑵ (3) ⑷的答案. 



• exp 



(x— 4) 2 +2 


V2 


(x—4)(y—3) (y-3) 2 

1 V2 ~ ~2~ 



(2) /xi = 4, // 2 = 3, ai = 1, cr 2 = \/2, p = 


V2 


• 182 . 



1 _ Qg -4) 2 

(3) Mx) = v^ e ~ 2 

(4) p{x\y) = ^exp{ - [^~ (y - |)] } 

【评注】通过本題让学生熟悉二元正态分布. 

( 7 3 2^ 

42•设 M = 0, 1；一 1 = 3 4 1 ,试写出分布密度 (3.2.12) 

V 2 1 2 ； 

并求岀 (6,6) 的边际密度函数. 

答（6，《2,6)的分布密度 


p ( x , y , z ) = exp | - ^ (7 x 2 + 4y 2 + 2 z 2 + Qxy + Axz + 2 yz ) } 


( K 2 ) 的边际密度函数 

P ( x ^ V ) = exp I - i (5 x 2 + 4 xy + } 

【评注】浅涉三元 正态. 

••43. 设$与7?是相互独立相同分布的随机变量，其密度函数不 
等于0且有二阶导数，试证若^ ^与《 — rj 相互独立，则随机变 

量 《一 均服从正态分布. 

证设€的密度函数为 P ( x ), + 的密度函 

数分别为/⑷，咖)，贝 ！I 


U + V 


K 2 


= f ( u ) g ( v ) 


ln P (^) + lnp (^)- ln 2 
记 h ( z ) = lnp ( z ), 则 


In f ( u ) + In g ( v ) 


+ *(— 2 ~) - ln 2 = ln /( u ) + lng ( t ;) 
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等式两边关于 U 求偏导得 


1 + • 丄 Uf (u-v\ rw 

々 mn 丁 ） = 7^r 


尸 ㈦ 


/⑻ 


上式两边再关于〃求偏导得 

1 
4 




令 V = U 得 


/ I "⑻一九"⑼= 0 

记/^0) = — A ， 又改写 u 为 a ;， 则得 

lnp(x) = -^x 2 + C\x + C 2 

于是 

-| x 2 + CixH - C 2 C 2 + 益一令(①一爭) 2 - 1(2 -亨) 2 

p(x) = e = e e = K e 

因 P ( x ) 是密度函数，故有 A > 0. 此外 ， Q = ^, C 2 = lnp (0). 

P ⑼ 

由此可见 （， T 7 服从正态分布，从而€ + 7/，€ - T ? 也服从正态分 
布. 

【评注】本题含意深刻，指出正态分布的一种重要刻画. 

44. 把习题25和习题26的结果推广到 n 个随机变量的场合. 
答⑴若心，… ，心是 n 个相互独立随机变量， 且&〜 B ( mi , 
P )， 则 

6 + • • • + 心 〜 B{mi + - • • + m n ,p) 


P{^i 






? Cn = I 6 + * * • + Cn ^ = 



其中，整数心彡0, i = 1，2, • • •， n ， A + … + = A 

(2) 若6, • • • ， 《 n 是相互独立随机变量，均服从泊松分布,参数 


_ J«4 • 



分别为 h ， … ， A n ，贝 ij 

《1 + • • • + (n 〜 P(^l + • • • + 入 n) 


P{《1 = 允 1,… ，€n = ‘ Kl + … +《n = 々 } 


= k \ / Ai \ kl ( A n \ kn 

fcl! • • • fcn! 、入 1 + • • • + 入 n J ^ Ai + * * • + A n / 

其中整数 fci 彡 0, i = 1, 2, • • •， n , A；i + … + fc n = &• 

【评注】二项分布与泊松分布的再生性是可预期的结果.有趣 
的是条件分布：在二项分布场合得到多元超几何 分布； 在泊松场合 
则得到多项分布. 

45. 设随机变量 $与 7 ) 相互独立，$〜 JB ( n ， p ), 而 r / 艮从 (0,1) 
上均勻分布，试求€ + 7 /的分 布函数和密度函数、 

解记 

h — (:) p Z 9 n -、 Z = 0，1，2 , …, n 

对 x < 0， 


对 x > n + 1, 


P{^ + r) < a:} = 0 


P{^ + r? < x} = 1 

又寸 fc < a : 彡 + 1, fc = 0,1, 2, • _ • , n ， 

尸 {€ + 7?< 工 }= 尸 {€ 十 77 < z ， ^k-l} + P{^ + r)<x, ^ = /c} 


+ P{( + rj < x, ^ ^ k + 1} 

= P {^ 彡 A ： — 1} + P {^ + 7] < X , ^ = fc } 
k-l 

=+ P {^ = A ：} P {^ + r ] < x K - fc } 
1=0 
k-l 

= ^2 bi + bkP{rj < x - k\i^ k} 

1=0 
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=+ bkP{r) < x - k} 
1=0 

k-l 

= ^k + - k) 

1=0 

即分布函数 

0, 
fc — 1 

nx) = E bi + b k (x - fc), 

I i=o 


x ^ 0 

fc < x < fc + 1, fc = 0,1, ••- ,n 
x > n+ 1 



密度函数为 


图 3-6 



fc < x ^ fc + 1, fc = 0,1,2, • • * ,n 
a: 彡0， x > n + 1 


【评注】讨论离散型变量与连续型变量之和，别具 一格. 

以上论证过程显然可推广到任意离散型变量与连续型变量之 
和. 

**46. 试求顺序统计量$与 G ( A : < Z ) 的联合密度函数. 
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解对 : C 〈仏 见图 3-7 

P{x <x + Ax, yd <y + Ay} ( 化为多项分布） 

= (AT— 1 — )! i! (/--fc-l)!l!V-0! [ F ⑻广 1 P ⑻心 

• [F(y) - F(x + Ax)] l ~ k ~ l p{y)Ay[l - F{y + Ay)] n 


k-\ 


l - k-l 


n^l 




x jc+Ax 


y y^y 


图 3-7 


故 

r - - - [F(x)l 卜 1 

(fc-l)!(Z — fc — l)!(n — Z )! L 、 

P ul , t) {x,y) = < .[ F ⑼ - 厂⑻广卜 1 P - ’)] n_ W)P(l /)， 

X <y 

0， x>y 


【评注】但愿读者学会这种既直观又便于记忆的方法 • 50 年笔 
者于 51 年前从匈牙利专家 Vincze Istvan 处学到. 

47. 试利用概率的连续性重新证明一元分布函数的性质 （ ii ) 和 
性质 （ iii) ， 并说明这种证法可推广到多元的场合 . 

证 关于性质 (ii): 

记 yl m = {< < —m}，m = 1 ， 2,3, _ • • ，贝 ij 

oo 

^■m Am+l, lilTl -Am ~ ^-m ~ ^ 

m—*oo • 1 

m=l 

而根据概率的上连续性知 

lim F(—m) = lim P{^ < 一 m} = lim P(A Tn ) = P( lim A m ) 

m—*oo m—*oo m—oo m—oo 



• 187 - 


利用 F ( x ) 的单调性即知 lim F ( x ) = 0. 

x—^—oo 

同理可证 lim F ( x ) — 1. 

x—+oo 

关于性质 ( iii ): 

记 i4 m = {a: 0 - ^ c < 工 o}，m = 1 ， 2,3 ， .“ ，贝 lj 

oo 

-4/71 Z) lim A m = r"') -Arn = ^ 

m—oo ■ 1 

m=l 

于是 

lim \f(x 0 ) - f(x 0 - —)1 = lim P{A m ) = P( lim A m ) 

m—»oo L \ 771/ J m— kx> m—^oo 

=P(0) = 0 


r 1 

F(x 0 ) = lim F(x 0 - ) 

m—^oo \ 771/ 

仍由 F ( x ) 的单调性知分布函数左连续. 

对 n 维随机向量佑， …， 60的分布函数 F ( x x ,-.-, x n ) 只证 
F(+oo, …， +oo) = 1. 

记 Am = {6 < +爪 ，…， Cn <心+爪 }， m = 1，2,…，则 

oo 

Am C -Am-j-i ? lini Ajji = I J -Atji = f2 

m—>oo ^ 

m=l 

根据概率的下连续性知 

lim F(ki + m ， … ， fc n + m) 

m—♦cx) 

=lim P{^i < A：i + m ， … < k n + m\ 

m—oo 

=lim P(A m ) = P( lim >l m ) = P(j?) = 1 

m —*00 \ m—oo 7 

利用分布函数的单调性知 


lim F(x \ 1 * - * ,x n ) = 1 

: El—+ 00 

+oo 


其余部分请读者补足. 
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【评注】《概率论基础》用可列可加性证明 （ ii), (iii), 好处是只 
用概率三公理，而且可看出分布函数三性质与概率三公理的对应， 
但在多元场合，用作为公理推论的概率的连续性似乎更方便. 

M 8. 利用随机变量分布解释贝特朗奇论. 

解 参看《概率论基础》图 I . 4 . 4 . 

(1) 将弦的一端4固定，另一端 B 在圆周上选取.以6表示 
沿逆时针方向沿弧长,若 6 在 (0, 2jt) 上服从均匀分布，则 

P { 弧长 > V 3} = P{y < 6 < y } = ■ 

(2) 假定弦垂直于某直径，取该直径为2/轴，圆心为坐标原点， 
以6表示弦的中点坐标，若6在[-1, 1] 上服从均匀分布，则 

弦长> = P {- 臺< & < •卜会 

(3) 以圆心为原点建立直角坐标系 XOY , 记弦的中点坐标为 
V — ( V1 , V2 )， 若 V 在圆内 {{ x , y )\ x 2 + y 2 ^ 1} 服从均匀分布，记 

D = {(怎，2/) x 2 + y 2 < ■} ，则 

P { 弦长 < v /3} = P {7； G D } ^ 

三种解法中的随机变量服从三种不同的均匀分布假设，所以 
得出不同的结论. 

[ 评注】至此总算对贝特朗奇论有个交待. 

*49. 若/是 D 上单值实函数，对 B C R 1 ， 记 f - l [ B ) = { a；G 
Q : f ( u ) G B } y 试证逆映照/- 1 具有如下 性质： 

xeA \eA 

(2) /-' fl 私) = fir 1 ⑻); 
xeA xeA 



证 （1) 若 cj € /"~ l ^ 汉\>，则 /( w ) € U 汉\，必存 

xeA \eA 

在 A Q € 3使 /Me B Xo , 亦有 O ； e /-^ Sao ), 从而 
w u 厂 1 ㈤ • 

入 e/t 

mx /^(U^c u r l (B X ). 

X^A 入 

反之，若 o ; € U r l { B x ), 必存在 A。e yl 使 u ; € r l { B Xo ), 

X^A 

亦有 /M e s Aq ，即 /M e IJ s A ，从而 o ； e r x ( |J B A ). 

入 €/! \£A 

••• / -1 ( U S 0 〕U 厂 1 ㈤ - 

入 

于是有 U /" 1 ^). 

X^A A€A 

(2)，（3) 可类似 证明. 留给读者作为练习. 

【评注】为证两个事件等价采用由定义出发的证明，看似笨拙, 
但舍此并无他法. 

**50. 证明：$是一个随机变量当且仅当对任何 : r e R 1 ， 成立 

{ o ; : ^( cj ) < x } e 

[提示：必要性是显然的，为证充分性，记 m = { A : A CK 1 , 
e A ) € 多}，验证 m 是 a 域，又 m 包含全体形如 （- oo ， x ) 的区间， 
故 m 包含滅 ] 

证必要性：设纟是随机变量，则按《概率论基础》定义 
(3.1.1) 对任一 s e 為有 { a ; : ^( a ;) e S } e 多，又 (- oo . x ) e 3 S X , 
有 

{co : ^(cj) < x} = {a; : ^(cj) € (—oo,x)} e ^ 

充分性：记 m = {^4 : A C R 1 , ( u ; : ^( lj ) e A ) e 多}，现证 m 
是 R 1 上的 (7 域. 

(1) {a; : 咖 ） e R 1 } = e 多，故 R 1 Gm ； 
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⑵ 若 S € m ， 由 49 题 ⑶ r l ( B ) - TMB ) 得 

{cj : 4(w) € = 12 — {cj : ^(a;) E B] G ^ 

即 B e m ， 故 m 对余集运算 封闭； 

(3) 设疚 e m，i = 1，2, …，由 49 题⑴的结论得 

oo oo 

{u; : ^(u;) e (J Bi} = y {a; : ^{lj) G Bi ) e ^ 

t=l i=l 

即 G 私 etn ， 故 m 关于可列并集运算封闭. 

i=l 

由⑴一⑶知， m 是 a 域，由条件知 

{(— oo , rr ) : x G R 1 } C m 

所以 ， m 3 a{(—oo,x) : x 6 R 1 } = 

其中 a { A } 表示由集类 4 产生的 a 域，由此得证纟是一随机变量. 

【评注】本题完成了《概率论基础》中引用未证的第一个测 
度论结论（见原书 119- 120页）的证明，用的是典型的测度论方 
法，很新颖但并不难. 

显然，这个证明只要稍作符号替换就能用于随机向量场合，这 
就证得该书第二个引用待证的测度论结论（见原书 142 - 143页). 

《概率论基础》不把证明直接写入正文而编入本章最后两道 
习题，自有深层 考虑. 


习题总评 


第三章习题的主角是分布.大部分习题围绕分布的表示，分布 
的计算，分布的性质，分布的推导而配置. 

前两章的习题主要是计算，求正确的答案.本章则主要是演算， 
用微积分及级数为工具作多种分析推导.不少题还是以证明题的 
形式出现，题中已指明了答案.总的说，做出结果并不太难，但每个 
题目背后的意义则常为学生们所忽视，因此希望同学们在完成每道 
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题之后务必要花一定时间思考一下题目的含意和回顾一下解题的 
思路，才不会“空入宝山”. 


I 章后小议 

随机变量的引进使对随机现象的处理更简单更直接，也更统 
一而有力，是观念上的一大进步，随机变量概念的引进也使概率论 
融入以分析为主流的数学，命题表述变得清晰，研究工具大量增加， 
讲授进度显著增快. 

在公理化体系中，随机变量定义为样本空间到欧几里得空间 
的可测映照.这样一来，事件用随机变量的某个关系式表示，概率 
则通过分布函数计算，许多概率问题化为分析问题. 

当然上述定义有很深奥的测度论背景，但单从操作层面上看， 
对随机变量就可以进行加减乘除等算术运算和微分，积分及求极 
限等分析运算，而分布函数则是分析性质良好的单调函数. 

分布函数成了研究的中心.很多研究成果通过各个分布函数 
积累起来.理清这些材料并使之系统化，在本章正文和习题中都有 
所体现，尤其让离散型与连续型等待时间分布以对称的顺序出场, 
在《概率论基础》之前的概率论教本中似未 见到. 

在多维场合，随机向量由多元联合分布完整描述，而边际分布， 
条件分布等新概念的引进更是丰富了研究主题.不过，有名的多元 
分布比起一元分布少很多，除了出于摸球模型的多项分布和多元超 
几何分布外，多元正态与联系几何概率的均匀分布是主要的例子. 

独立性概念从事件推广到随机变量，并在许多讨论中起关键 
作用.列联表对比了两类摸球模型，而矩形均匀分布则回归到几何 
概率. 

概率论中的主角正态分布终于在本章登场，受到最大的重视， 
给出了髙斯推导，还有典型分解，逐步走向舞台中央. 

随机变量的函数仍然是随机变量有了明确的含义，因而又回到 
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/ ⑷ + /( y ) = / (工 + y ) 

/( 工) • /(2/) = /(工 + y ) 
/ ⑷ + /(y) = /( 工 y) 

/(^) - f{y) = / ㈣ ） 


求分布函数的老问题上来，这是本章技术训练的重点.《概率论基 
础》采用一对一，多对一，多对多三个类型与直接法，变换法两种 
方法交叉的形式，既对方法作了比较全面的介绍，又导出不少重要 
的结果，特别是给出统计学三大分布: x't，F 的理论推导. 

均匀分布作为分布函数转换器的特殊地位被揭示.顺带证明 
了随机变量的存在性定理，这类定理一般被人们在不知不觉中使 
用，很少点明.从数学的形式逻辑观点看，具有某分布函数的随机 
变量的存在性问题不能说不重要. 

极小值与极大值联合分布的推导为统计学作了重要准备. 


教学札记之 -1 I 

柯西方程与分布刻画 

《概率论基础》引理 2 A 1 证明函数方程 f(x)f(y) = f(x + y) 
若对一切 X ，2/ (或一切 x ^ 0, y ^ 0) 成立，则只要假定 f(x) 是连 
续函数或单调函数，其解必为 /㈤ =忒其中 a > 0,为常数. 
事实上这类方程共有4个， 


它们通称为柯西方程.可以证明：若它们在一定范围成立，且 / Or ) 
满足微弱的条件（例如只要假定满足 （1) 的函数是可测函数)， 


则这4个函数方程的解分别是 

f(x) = ax ⑴’ 

f(xX 6 彡 0 ( 2 )' 

f(x) = log c x, c > 0 ⑶’ 

f(x) = x a ⑷ , 


\J/ \J/ \)/ \1/ 



✓fv /f\ /IV /l\ 
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正好对应 4 种初等函数 • 方程 （1)(2) 可以互化，因此实质上只要 
研究一个方程，《概率论基础》择便选了方程 （2). 

显然上述某些结果可推广到: r ， y 只取整数的场合.例如可参 
看《概率论基础》引理 4.3.1- 

分布刻画是概率论的一个研究专题.人们发现，只要具有某个 
性质就一定是某某分布，例如若具有无记忆性，则连续型非负随机 
变量一定服从指数分布，离散型则对应为几何分布.因此寻找各种 
分布具有的特征性质便成为一个研究热门，就产生了分布刻画这一 
研究专题.这个研究专题,上承概率论,下接数理统计，具有重要的 
理论意义和实用价值. 

在分布刻画的研究中常归结到柯西方程.《概率论基础》重视 
对分布个性的介绍，因此多处涉及这些内容,所以引入引理 2.4.1. 

相关内容有：《概率论基础》中第二章泊松过程推导中 P 0 ( t ) 
的 导出； 第三章§1几何分布与指数分布的 刻画； §2正态分布的高 
斯 推导； 习题三10题均匀分布的 刻画； 习题三题对正态分布 
的刻画.有关的尚有第四章熵的表达式的推导以及用最大熵刻画 
均匀分布、指数分布及正态分布，还有习题四 **43 题对泊松分布 
的刻画. 


教学札记之十二 I 


关于两个等待时间分布序列 

一、两个等待时间序列 

若每隔进行一次试验，则伯努利试验可以看作一个随时间 
而变化的随机过程，关心的是到时刻 f 成功出现的次数,记作 X ( t ), 
t = At , 2 At ， …， nAt , 称为成功概率为 p 的伯努利过程. 

以 y ( t ),^ o 记参数为 At 的泊松过程到时刻 t 来到的呼叫数. 

X ⑷与 F ⑷随 < 变化的图形都是跳跃高度为1的上升阶梯 
函数，其跳跃时刻分别为成功出现与呼叫到达的时刻. 
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伯努利 过祝 : 



Vi 




1 t 1^1 I I M 1 I 金垂 I 


Vr 


nAt 


图 3-8 

泊松过程： 

~~~ ^ 

r \ & 

图 3 - 9 



从《概率论基础》第二章的讨论可知， • 

P { X ( nM ) = fc }= ^ P k Q n ^\ fc = 0,1，2 ,…， n ⑴ 

而 

P{y{t) = k) = e~~' A: = 0,1,2, ••• (1)’ 

从第二章 § 3 及第三章 § 1 的讨论又知道 ,• 

若以 m 记伯努利过程第一次（首次）成功出现在 kAt 其概率 
服从几何分布 

Q k ~ l P, k = 1,2,••- (2) 

若以 n 泊松过程第一个（首个）呼叫出现时刻，其概率分布 
为指数分布 


入 e t > 0 ( 2 )， 

若以&记伯努利过程第 r 次成功出现在 fcAt , 其概率服从帕 
斯卡分布 

( UpV— ，fc = r，r + l, … ⑶ 


若以记泊松过程第 r 个呼叫出现时刻，其概率分布为埃 
尔朗分布 


l^W ， 


t 彡0 
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帕斯卡分布与埃尔朗分布分别可以推广成对任意实数 r > 0 
都有意义的负二项分布及 r 分布. 


二、两个分解式 

在伯努利过程中，第 r 个到达时刻&有如下分解式： 

Cr=m+V2 + -^ + Vr (4) 


其中％表示从第 i - 1次成功到第 i 次成功之间的试验次数，简称 
第 i 次等待时间.其中第1次等待时间爪前已定义，并知道它服 
从几何分布 （2). 下面我们要进一步 证明： 

定理1 …，〜 相瓦 独立，均服从几何分布 （2). 

证明 由⑷知 


m = 

=Cl 


V2 = 

- C 2 -Cl 

( 5 ) 

Vr = 

= Cr ~ Cr —1 



对任意正整数 h k 

P{m = h ， V 2 — h - h } = P{Ci ~ hX 2 — h } 

=P{X(Ai) -0,--- ,X((h-l)At) = 0,X(hAt) = 1, 
… ,X((i 2 -l)At) = l,X(I 2 At) = 2} 


q … q p q … q 

v— / s —v^— / 

ll — 1 ^2 _ 在 1 ~ 1 


V 


= g “ - 1 V 2 - “- 1 .p 

= P{rfi = li}P{m = h - ^i} 


一般地，对正整数 h < l 2 <---< l r , 

P{vi — h,V 2 = G - ,1，… ,Vr — lr - U 
= 尸 {<1 = ,1， （2 = G ，… >Cr = lr} 

= q h 一 i pq h 一 ll 一 1 p • • • q 11 ^- 1 - 1 p 
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= 尸 {r/i = li}P{r]2 = h — h} - ' P{Vr = Z r — / r ~i} 




由 X 的任意性知 …， vr 相互独立，均服从参数为 
p 的几何分布. 

同样地,对泊松过程，第 r 个到达时刻队有如下分解式 •. 

= n + T 2 + • • . + 7> ⑷’ 

其中 TV 表示过程从第 i - 1次到达到第 i 次到达之间的时间间隔， 
也简称第 i 次等待时间，其中第1次等待时间 n 前已定义，并知 
道它服从指数分布（2)\下面进一步 证明： 

定理]/ T!,r 2 , … ， 7V 相互独立，均服从指数分布 （2)', 

证明 记 

Ti = W\ 

T2 = W 2 — Wi (j\ 


Tn = - W n . 


下面来导出 ( T 1? r 25 ..., r n ) 的联合密度函数. 

我们先来导出 ( W U W 2r - , Wn ) 的联合密度函数，下面推荐 
-个简捷的做法.选 

々 < 々 + A^i < 5 2 < 5 2 + A ^2 < •- < S n < S n + As n 


O s \ s \ + ^\ h ^ 2 + 




s n 


图 3-10 


则利用泊松过程的独立增量性、平稳性和关于增量分布为泊松分 
布的结论，可知 

P{5i^Wi<5i + A.9 i, 52 ^ W2<324-A52, • * ', 5 n <Wn<5n+ASn} 

= e -A Sl x A(si + Agj - Sj) e ^ A(si+Asi . Sl) ⑻ 

X 1 

X e- 入 ( ， 2- A^i) x AA«2 

1! 
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X … X ('-'、(〜 • 


■△ 〜一 1) x A △ 方 n c ~AA.s t 


1! 


入 n e Sr ‘△ Si /\ s < 2 ’ ’ . ^ S n + 0( Z ^. SiA ^2 . ， • △各 n ) 


因此 

P ( iv l 5 vv 2l ， w „>( s l ， 5 2 , ••’ , S n )= 


A n e — 入' s \< s 2 < .••<•% 


，其他 

用变换法得到 

= \ e^ Xu Ae' xti Ae ^ xt? 


( 9 ) 


( 10 ) 


故知 , r n 相互独立，均服从 Exp ( A), 从而完成了证明. 

当然上述过程也容易用来证明逆命题，即若 n，r 2 ，…， Tn 相互 
独立，均服从 Exp (A)， 则 { W u W 2r - , W n ) 服从⑼，不过这个逆 
命题还有多种多样的证法. 

顺便指出，由⑼也能导出的边际分布密度 

Pw r M = ^~Jy e r=l,2,- - 

至此我们已对《概率论基础》作了适当的补充. 


三、两列分布对比 

两列等待时间分布有许多共性，列表对比于下: 


分布 

概率分布/密度函数 

均值 

方差 

特征函数 

特征刻画 

几何分布 

■BB 

■ 

± 

p 2 

Ea 

无记忆 

指数分布 


■ 

B 

DEB 

无记忆 

帕斯卡分布 

mm 

H 

WBk 

El 


分解式 （ 4) 

埃尔朗分布 


1 

rA _1 

i 

rA - 2 

BH 

分解式（ 4, 
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四、附言 

《概率论基础》第二章§3给出了伯努利试验的描述,§4给出 
了泊松过程的结构分析. 

定理 2.4.1 给出泊松逼近定理及其直接证明，第四章§4例7 
用母函数法重加证明. 

第二章§3给岀几何分布、帕斯卡分布的定义. 

第三章§1讨论了几何分布、帕斯卡分布、指数分布、埃尔朗 
分布的定义与性质，并推广到负二项分布及 r 分布. 

习题三 *8 题要求学生证明用埃尔朗分布逼近帕斯卡分布. 
第五章§2用特征函数法再次研究上述逼近. 


教学札记之十三 I 


摸球与抽样 

《概率论基础》中摸球模型多次出现，许多重要的概念是经它 
引入的. 

摸球模型作为抽样的模型，首先出现在古典概型中.在装有 a 
只黑球6只白球的袋中摸出一球，求摸得黑球的概率是典型的古 
典概率计算.接着自然地考虑多次模球的情形，这时发现必须区分 
放回与不放回两种方式.首先证明了 “抽签与顺序无关”，即第 A : 
次摸得黑球的概率为常数，与 A ; 禾关，这是对不放回摸球讲的，因 
为对放回摸球这是不言而喻的. 

其次,导 出了二 项分布与超几何分布这两个重要的分布，前者 
针对放回摸球，后者针对不放回摸球，显示了二者的重大区别. 

第二章考察了摸球问题的前后结果事件4与 S ， 发现其条件 
概率在放回摸球与不放回摸球两种情况下有重要差别，这启发引人 
独立性概念. 

n 次有放回摸球是伯努利试验的重要特例，在这个试验中二项 
分布成为研究中心，还能导出其他分布，例如几何分布与帕斯卡分 
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布. 

第三章用随机变量 (^ r ?) 描述摸球问题，讲了列联表——表 
3.2.1 与 3.2.2, 它形象地告诉我们：放回摸球的各次结果是独立同 
分布的，而不放回摸球是不独立的，但还是同分布的. 

把双色球推广到多色球，这时放回摸球模型成了推广的伯努 
利试验，导出多项分布，而不放回摸球则导出多元超几何分布. 

若每个球对应一个数，则摸球问题对应抽样调查这一社会科学 
中最主要的统计方法.所需计算，在放回场合各变量独立，容易处 
理； 而在不放回抽样这一实用场合，各变量不独立，它们的相关性 
使计算复杂化，但《概率论基础》第四章§2例10介绍了这种场 
合的巧妙处理方法，并顺带导出超几何分布的均值与方差表达式. 

对于随机变量 X 取无穷个值的情况，这时不宜再用摸球模型 
的形象与术语，但抽样的术语照用，放回与不放回已无差别，因此 
统计学中把独立同分布观察样本（称为简单随机样本,可以来自有 
限总体或无限总体）作为研究对象建立起当代数理统计学，而把只 
研究有限总体的抽样调查作为一个重要分支. 

总之，摸球作为有限总体抽样的形象模型，概要如 下表： 


^ 放回 独立同分布—数理统计 
( tt #) 不放回不独立同分布_抽样调査 


摸球模型还可以有许多变形，例如在第二章波利亚坛子模型 
中，通过中间加入若干个某色球来改变摸出各色球的概率，成为很 
有用的新模型,该模型不但被用于传染病学研究，还成为一种表达 
力很强的随机过程. 


教学札记之十四睡 


正态分布的两种刻画 

自高斯以样本均值为总体均值的最大似然估计导出正态分布 
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以来,逐渐发现正态分布的另外一些刻画性特征，这里介绍其中最 
重要的两种. 

射击弹落点分布 在火器射击问题中，假如过射击目标中心作 
直角坐标系的: r 轴及 2 /轴.每次射击弹落点由于受随机因素影响 
会偏离目标，它的坐标 (^ V ) 是一个二维随机变量，假定满足如下 
三个条件： 

( 1 ) 《与 r ； 分另 y 具有连续密度函数 pi ⑻及 P2 ( y ); 

( 2U 与7；相互 独立； 

(3) ⑷ r ?) 的密度函数在 { x , y ) 点的值仅与它到原点的距离 r = 
y / x 2 + y 2 有关， 

则€与 U 均服从正态分布 • 

下面我们就来证明这个结论.为不打断证明思路，特把用到的 
一个分析结果写成引理，它本身也颇有意思 • 

引理若 /(: r ) 及 0 ( y ) (x ^ 0 , y > 0 ) 是不恒等于 0 的连续函 
数，而且对一切非负实数 x 及 2 /成立 

f{^)g{y) = + y) (*) 

则 

f { x ) = ka x , x ^ 0 (**) 

这里 fc 及 a 是常数，而且 a 〉 0 . 

证明 首先证明/(0) 一 0. 用反证法，假定/(0) == 0,则 
h { y ) 三0，由于 p ( y ) 不恒为0，有一个 yo 使 9{yo) 7 ^ 0,因此 

f ( x ) = h ^ x -± y°l = 0,这与 /( x ) 不恒等于0的假设矛盾，从而 
9\yo) 

证得/⑼# 0, 同理可证 W0) / ()• 

其次，在 (*) 中令 a ? = z，y = 0,得到 f ( z ) g (0) = h ( z )， 又在 （*) 
中令 x = 0, y = z , 得到 f {0) g ( z ) = h ( z ), 因此 


/( 咖⑼= /( O ) p (^) = h ( z ) 
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两边除以 m 9 ( o ) 并记得到的比值为 P { z \ 则得 

/(^) ^ 9^) ^ h{z ) = 
/(0)、(0厂 f (0)9(0) "" P[ } 

代人 （*) 式得 

p{x)p(y) = p(x + y) 

利用《概率论基础》的引理 2.4.1 知 


因此 


p ( x ) ― a x , a > 0 


/(x) = /(0)a x 

引理得证. 

下面来证明主要结果. 

记 （$7/) 的密度函数为 p ( x , 3 /), 由假定⑶町知 p ( x , y ) = 
q ( y / x 2 + y 2 ), 再由假定⑴，⑺知 

Pi (^) P2 ( y ) = q {\/ x 2 + y 2 ) 

因为 PU 岣及 P 2 ( y ) 为密度函数，当然不能恒等于0,故可利用引 
理（把 Pi ( x ) 看作 /(: r 2 )， 把 p 2 { y ) 看作 g { y 2 、' 再把 q ( y / x 2 + y 2 ) 看 
作 / i ( x 2 + y 2 ))， 得到 

Pi ⑷ = fca x2 

由于 Pi ( t ) 是 (-oo,og) 上的密度函数，故有0 < a < 1，记 a = 
_ 1 

其中 q 〉0,利用规范化条件可得 fc = ^—，这样一来， 

V2nai 


外 ⑻= 


x 2 

1 -河 
\ph\.a\ 


因此《服从正态分布，同理可知 r ? 也服从正态分布. 

以上内容见于《概率论基础》第一版及第二版.在第三版中 
它为高斯推导所代替. 
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气体分子速度分布1859年麦克斯韦在气体分子运动的研究 
中，在很简单的假定下也导出正态分布. 

若以 C 代表分子速度，它在 X ，?/， z 方向的三个分量分別记为 
C /， K ， W ， 则 C 2 = C/ 2 + V 2 + W 2 . 麦克斯韦对这些随机变量的分 
布提出如下三个假定： 

(1) 速度分布存在具有连续导函数的密度 函数； 

(2) U y V , W 相互 独立； 

(3) 平衡态时，速度分布在速度空间是各向同性的 (isotropic). 
可以证明，这种情况下， t /, V ， W 的分布必为正态分布. 

证明由假定，存在一维密度函数 p { x ), U , V : W 均以它为密 
度函数，若以 p ( u , v , w ) iS ( C /, K , W ) 的联合密度函数，由假定⑻ 
知 p(ii ， V ，议） = q ( u 2 + 汐 2 + 忉 2 )， 由假定 （ 2) 

p ( u ) p ( v ) p ( w ) = q ( c 2 ), u 2 + v 2 + w 2 = c 2 (1) 


两边取自然对数得 


\ np ( u ) + lnp ( v ) + lnp ㈣ : - lng ( c 2 ) 


(2) 


两边对 u 求导得 

1 dp ⑷ 1 dq(c 2 ) dc 2 

■ • ■ =n 一 • ■ - - 

p(u) du q{c 2 ) dc 2 du 

整理成 


1 dp ( u ) 

2 dq ( c 2 ) 

up ( u ) du 

q ( c 2 ) dc 2 


显然 （4) 的左端与％ i 

/；无关. 

同理可得 

1 

dp ( v ) 2 dq ( c 2 ) 


vp { v ) 

1 — 一 : 
di? 

Q ( c 2 ) 

dc 2 

1 

dp(iy) 

2 

dg(c 2 ) 

wp ( w ) 

dw 

q { c 2 ) 

dc 2 


⑶ 

⑷ 


(5) 

⑹ 


显然 （5) 的左端与 u ， w 无关，⑹的左 端与* u ， v 无关，故必有 

1 dp ( u ) 

一 • ~7 ""n — = (X 

u p(u)du 
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其中 Cl 为常数，因此 


p ( u ) = be 



⑻ 


为使 p ( u ) 为密度函数，应有 a < 0,若记 a = 其中 m 为质 
量， fc 为玻尔兹曼常数，: T 为绝对温度，则由规范化条件知 



m 


2 jt / cT 


⑼ 


故 


p(ix) = 


I - mix 

/ 爪 2fcT 

V 2jtfcT e 


( 10 ) 


这正是^). 

《概率论基础》习题三36题以此为出发点导出麦克斯韦分布 
律. 

麦克斯韦的气体动力学理论开创了统计物理学,连同他在电磁 
场理论方面的伟大贡献，使他成为19世纪首屈一指的物理学家. 

顺便提及，本札记第一种推导用柯西方程，第二种推导用求导， 
这是解决这类问题的两种常用手段，一般都可互换. 

顺带指出，第四章§3用最大熵概念给出了正态分布的另一个 
刻画.此外，习题三 * M 3 题也是一种刻画. 

教学札记之十五 I 


统计物理学和概率论 

一、麦克斯韦分布 

由于牛顿力学所取得的成功，直至19世纪上半叶，物理学的 
目标是建立以能量守恒定律为统一原理，充分利用数学工具，寻求 
物理现象的力学解释.例如对热现象就以分子运动学的观点建立 
了热力学.它解释了许多现象，也遗留下一大堆问题. 
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力学上研究粒子和粒子组的运动,可以根据初始条件求解其运 
动方程来进行，但当一个宏观物体由大量微观粒子组成,理论上求 
解数量如此巨大的运动方程和实验上确定这么多粒子的初始条件 
都是不可能的.热现象研究的是大数(10 23 数量级）的微观粒子组 
成的系统表现出来的宏观现象.由于粒子之间以及系统与外界之间 
存在相互作用，粒子的运动变得十分紊乱，异常复杂，因而具有不 
完全确定性.一些在单个粒子运动中起重要作用的因素，像初始条 
件，在整个系统状态的演变过程中变得次要甚至不起什么作用了， 
而相互作用则导致系统在某一时刻处于何种状态呈现随机性.系 
统中除单个粒子遵从力学规律外，还岀现一种与力学规律迥异的 
新的规律即统计规律性. 

1859年英国物理学家麦克斯韦 （ J . C . Maxwell , 1831 — 1879) 
在克劳修斯气体分子运动研究的基础上尝试采用关于速度分布的 
统计分析方法来研究气体.麦克斯韦认识到气体的运动太复杂，以 
至于难以用牛顿定律去描述.更重要的是气体的性质例如压强和 
温度是整体的性质.一个分子的运动不如作为整体的气体的运动 
重要，因此要了解气体的性质就需要把气体作为整体进行概率描 
述，而不是用决定论的方式去描述每个分子.麦克斯韦还证明了在 
相当简单的假定下，能导出分子速度的分布，而系统的宏观实测值 
则是一切可能微观状态的统计平均值.于是统计物理学被建立，它 
的基本任务就是采用概率论方法探求大数粒子系统的统计规律，从 
而找出系统的宏观性质及其规律.这个理论的诞生对概率论的发展 
无疑有重大刺激作用. 

《概率论基础》用第二章§4例7 (分子运动）来介绍这类系 
统，并在第五章§ 1最后答案中指明宏观结果的稳定性.习题三36 
题给出气体分子速度的麦克斯韦分布的推导，而习题四10题则求 
出分子的平均速度和平均动能.这类结果后为实验所证实. 
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二、近独立粒子的三种统计 

统计物理学研究对象都是大数微观粒子组成的系统.在承认大 
数微观粒子系统运动带有统计规律性的前提下，寻求系统出现在各 
个微观状态的概率分布,再利用这个概率分布来求得宏观物理量的 
统计平均值，因此确定各微观状态出现的概率是统计物理学的根本 
问题. 

奥地利物理学家玻尔兹曼 （ L. Boltzmann, 1844 一 1906) 发展 
了最概然 （most probable) 统计法，它适用于由大数全同和近独立 
粒子组成的系统.所谓全同粒子是指质量，电荷，自旋，同位旋等各 
种内禀固有属性都完全相同的微观粒子.在经典力学中，由于可以 
从粒子运动的不同轨道来分辨不同的粒子，所以即使是全同粒子 
也总是可以分辨的，原则上可将同一种物质的粒子进行编号.所谓 
近独立粒子是指粒子之间的相互作用可以忽略，即粒子之间的相互 
作用的能量远小于粒子自身的能量，这种粒子包括理想气体，黑体 
辐射中的光子气体等等. 

为了描述这种微观粒子，假定它们在某一时刻总处于相空间 
的某个点，称为相点.随着时间变化它描绘出一条曲线，称之为相 
轨迹.为便于进行统计，将相空间分成许许多多小体积元，这种小 
体积元称为相格.若将粒子比作球，则讨论粒子在相格中的分配问 
题便归结为组合分析中投球人格的计算. 

玻尔兹曼早在 19 世纪 70 年代就提出著名的等概率原 理：孤 
立系统（它和外界既不交换物质又无相互作用）处于统计平衡时， 
其所有可能的微观状态出现的概率相等.这是一个合理的假设，也 
为大量实验所证实. 

这样，若把 n 个可分辨粒子分配到 p 个相格中则按重复排列 

共有 

9 n ⑴ 

种方式.按等概率原理，它们是等可能的，从而可以进行各种古典 
概率计算.物理学家把这个模型称为麦克斯韦-玻尔兹曼统计. 
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这种统计有两大假设 ： 1° 粒子是可分 辨的； 2°每个相格可容 
的粒子数无限制. 

《概率论基础》第一章§3例4中提到这种统计. 

当研究尺寸为原子大小的物体性质时，人们发现经典的麦克 
斯韦-玻尔兹曼统计往往与实验结果存在明显的不合.这样小的 
物体属于量子力学研究的范畴.由于微观粒子具有波粒二象性，每 
个粒子总是与一个波相联系，在大量粒子存在的空间中，会出现两 
个波重叠在一起的情形，在波的重叠处，无法区分第一个粒子的波 
和第二个粒子的波,从而不能分辨第一个粒子与第二个粒子，所以 
这种全同粒子是不可分辨的，不能编号的. 

1924年印度物理学家玻色 ( Bose ) 提出一种新统计： n 个不可 
分辨的粒子在5个无限制相格中的分配共有 


种方式.按等概率原理，它们是等可能的.以这个古典概率模型进 
行概率计算，物理学家称为玻色-爱因斯坦统计.它适用于光子, 
自旋量子数为整数的基本粒子及含有偶数个基本粒子的原子或分 
子或原子核,通称玻色子. 

1925年泡利 （ W . Pauli ) 发现“不相容原 理”： 不能有两个或两 
个以上的全同粒子处在同一状态，由于这个原理，在相空间的单位 
相格（量子态）中不能有一个以上的电子，故电子及其他自旋量子 
数为半整数的基本粒子在相空间的分布须另考虑. 

这时费米 （ E . Fermi ) 与狄拉克 （ P . A . M . Dirac ) 创立新的方 
法： n 个不可分辨的粒子在 g 个满足泡利不相容原理的相格中的 
分配共有 

( n ) ^ n ⑶ 

种方式.按等概率原理，它们是等可能的.以这个古典概型进行概 
率计算，物理学家称为费米-狄拉克统计.符合这种统计的粒子称 
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为费米子. 

下面举一个含有2个粒子，3个量子态的系统作为例子.可以 
看出玻尔兹曼系统，玻色系统和费米系统中2个粒子占据3个量 
子态的方式分别为9, 6, 3. 

这段讨论说明，等概率场合的确定不是纯粹逻辑问题，经验事 


实也要考虑.可能性的假定不是直接可以论证的，通常必须联系 


玻尔兹曼系统 
以① 0) 各表示一个粒子 

玻色系统让②=0)， 
①表示一个粒子 

费米系统让②=①， 
①表示一个粒子 

量子态 

I D 1 

量子态 

I n in 

量子态 

I n m 

0 XD 

0 XD 

0 X 2) 

① ② 

② ① 

① ② 

② ① 

① ② 

② ① 

雜 

雜 

0 XD 

① ① 

① ① 

① ① 

① ① 

① ① 

① ① 


在问题中用此假定的后果的实验验证. 

三、近独立粒子系统的最概然分布 

考虑一个由大数全同近独立粒子组成的孤立系统，其能量为 
E , 体积 K 和粒子数 iV 是确定的.以 。 (i =1,2,...) 表示粒子 
的能级表示能级&的简并度（一个能级的量子态数叫做该能 
级的简并度).系统的一个微观态就是 JV 个编了号的粒子在能级 
中各个相格（量子态）的一种分配.对 N 个粒子在各能 
级上的一个分配，物理学家以 { m } = fm ， n 2 , …，〜，…丨表示在 
能级^有化个粒子，并称为一个分布.显然 

〉: ~ N 、 〉: Tl{£i = E (4) 

i i 

一^分布与系统的一个宏观态相对应，给定一个分布卜小就 
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确定了占据每个能级的粒子数，但还不能够确定系统的微观态，这 
是因为能级的简并，每个能级不只有一个量子态，因此一个分布往 
往对应许多不同的微观态.在分布 { m } 给定后，如何确定系统的 
微观态呢？对玻尔兹曼系统，还须确定处在各能级^上的是哪^ 
个粒子，以及每一能级^上的叫个粒子占据其个量子态的方 
式. 

根据等概率原理,一个宏观态对应的微观态越多，这一宏观态 
出现的概率越大.在大数粒子系统中系统常处于概率最大的宏观 
态，它可近似地看作平稳态，所以求平稳态的分布就是求微观态最 
多的分布即最概然分布.这可用在约束 （4) 下的拉格朗日乘数法来 
求得. 

玻尔兹曼系统 

叫个粒子占据讲个量子态的方式数 为#% 任意分布所 
包含的微观态数为 

11 i 

i 

用拉格朗日乘数法，求在 （4) 的约束下的最概然分布，可从下 
式出发： 

lnr = +a ^N-^2 n ^) +^( E -^2 Uiai ) 

i i 

其中 a ，0 为乘数 • 

利用斯特林公式 

Inn ! = n(lnn — 1) 

最终求得玻尔兹曼分布 

’ ( 6 ) 

其中 /?- 1 = fcr ， 这里的 fc 为玻尔兹曼常数,: r 为绝对温度. 

这个分布适用于可区分的定域粒子，如理想气体等. 

特别地，理想气体在平衡状态下，能量 e = \ m{vl +vl + vl ), 
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玻尔兹曼分布化为 


f(v x ,v y ,v z ) = Ae 


2kT 


由规范化知 


3 m ( V X 十 4) 

/(〜、0 = (^)Y 2fcT 


因此，气体分子的速度向量 K = ( K x , V y , V ；), 各分量相互独 
立，且均服从 吻，5丫依 《概率论基础》习题三36题可知速 

度 S = ^ + V } + V z 2 服从麦克斯韦分布. 

麦克斯韦于1859年在14, %， V ；具有连续密度函数,相互独立， 
{ Vx ^ Vy , V z ) 的密度函数在 (v Xl Vy,v z ) 点的值仅与 s=yjvl +v^+v^ 

有关（即各向同性）的假定下导出 V x , V yj V z 均服从正态分布（参看 
教学札记之十四“正态分布的两种刻画”），并在此基础上导出气体 
分子的麦克斯韦分布.这些结果于1892年由迈克耳孙 （ Michelson ) 
用气体放射光谱法（间接）实验证明，于1920年由施特恩 （0. Stern ) 
用原子射束方法直接实验证明（吴大猷《理论物理（第五册）热力 
学，气体运动论及统计力学》，北京，科学出版社， 1983). 

玻色系统 


每个量子态对占据的粒子数没有限制， n , 个粒子占据&个量 
子态的方式数为~故任一^>布{叫}所包含的微观态 


数为 


妒 . 五 ( 卜 })=n 

i 


(gi + — 1)! 

rii\{gi - 1)! 


⑺ 


在约束 （4) 下导出最概然分布 

^ B.E _ 9 i 




⑻ 
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这分布适用于玻色子. 

费米系统 

每个量子态至多只能有一个粒子占据，必须仍> 71,个粒 
子占据&个量子态的方式数为，故任一分布 {〜} 所包含的 
微观态数为 ^ 

9 i } - 


" FD (w)=n 

i 

在约束 （4) 下导出最概然分布 


ni\{gi - rii )\ 


⑼ 


nf D 


9 i 


e 


a-f/3ei 


( 10 ) 


这分布适用于费米子. 

布里渊方法 

布里渊 （ L . Brillouin ) 采用下面方法把上述三种统计统一起来. 
设^个粒子以下列方式分配于个 相格： 首个粒子有&个 
分配法，次一个粒子有 9i — a 个分配法，第三个粒子有& - 2 a 个 

分配法， . ，第 ni 个粒子 有讲- (叫- l ) a 个分配法.因此这叫 

个粒子在&个相格的分配法为 

9 i {9 i - a)(gi - 2 a ) … (讲一（〜一 l ) a ) 


若这&个粒子是不可分辨的，则分配法为 

9 i(gi - o )(9 i 一 2 a ) • • • (讲 一 （ni — l ) a ) 

nil 

在约束 （4) 下导出最概然分布 

^一 1 , B _ E 分布 

G —丄 

… e aTi \ — = ) ^ 广一 ⑽， a = 0 ，分布 

e ^Jl + ? a = l ， F-D 分布 

当 a = 1 时，分配法有不与另一粒子同格之趋势，此效应与泡 
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利不相容原理 相同; 当 a = 0 Bt 格中有无粒子不起 影响； 当 a 二 -1 
时，粒子有较大概率聚于一格. 

以上分布在现代物理学中的基础地位与众多应用不在此处讨 
论. 


教学札记之十六 I 


置子力学的建立和概率论 


W . 汤姆孙（开尔文勋爵）在1901年 指出： 在物理学晴朗的天 
空中漂浮着两团乌云. 

到19世纪末，经典物理学，主要是经典力学、热力学和经典统 
计物理、经典电动力学，已发展得相当完善了，许多物理现象都能 
得到定性和定量的解释，但是也出现一些新实验，其结果无法在经 
典物理学中解释. • 

物理学是实验科学，新的实验事实提示了原有理论的不足，也 
促进了新的理论的诞生 . 20世纪初最为物理学家困惑的实验有两 
个:一^是迈克耳孙的观察证实了地球上的光速不依赖于地球绕太 
阳的运动，这与传统的“以太”学说严重 矛盾； 另一个是关于黑体 
辐射的实验与理论的背离.这就是开尔文勋爵所说的两团乌云.但 
正是对这两个实验事实的研究产生了 20世纪物理学的两大新理 
论.前者是爱因斯坦的相对论，后者是量子力学，它们的出现改变 
了物理学也改变了整个地球的面貌.下面我们来回顾量子力学的 
建立过程. 

一、黑体辐射与普朗克的量子论 

上述黑体辐射的实验得出了辐射能量密度随频率〃的分 
布规律.1893年维恩 ( Venn ) 利用经典热力学和电动力学给出了经 
验公式 

E u di / — C \ u 3 e^° 2t/ ^ T du (1) 
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这公式称为维恩公式，只在高频部分与实验数据吻合. 

1899年瑞利 （ Rayleigh ) 和金斯 （ Jeans ) 利用经典统计物理学 
和电动力学推导出 

E u du = 8 ^^ i/ 2 du ( 2 ) 


这公式称为瑞利-金斯公式，其中 C 为光速，它只在低频区与实 
验相符，在高频是发散的. 

1900年普朗克 （ M . Planck , 1858 — 1947) 提出了一个两参数公 


式， 


E v Au = 


0^/2 — 1 



这个公式在高频区化为维恩公式，而在低频区 ( e c ^/ T ^ 1 « 

C 2 v / T ) 以瑞利-金斯公式为极限(^ = ^, fc 为玻尔兹曼常 

数).这个公式在全频段与观察结果惊人地符合. 

两个月后，普朗克发现,如作假定：对于一定频率1/的辐射，物 
体只能以为单位吸收或发射它，则能从理论上导出普朗克公式 
(3). 

这就是普朗克的“量子说”.它断言，物体吸收或发射电磁波 
只能以“量子”的方式进行，每个“量子”的能量为 

e ^ hu (4) 


这里的 h 为一个普适常数，现称为 普朗克常数， h = 6.626 x 

nr 34 J • s. 


二、光电效应与爱因斯坦的光量子 

普朗克的量子说与经典力学中能量连续的概念完全不相容，因 
此他的理论并未受到人们的重视.1905年年轻的爱因斯坦 （ A . Eii > 
stein , 1879 — 1955) 发表了三篇论文，一篇创立相对论，一篇解决了 
布朗运动的难题，第三篇解释了光电效应.最后那篇文章使他后来 
获得诺贝尔奖. 
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1900 年勒纳 （ Lenard ，1862 — 1947) 的实验证明 •• 金属在紫外 
光的照射下发射电子,这种逸出的电子称为光电子，光电效应的实 
验结果是： 

⑴存在临界频率外，当人射光的频率〃 < ZA ) 时，无光电子逸 
出.只有当^彡冲时，短时间内就能观察到光电子.不同的金属有 
不同的 I / O . 

( ii ) 出射的光电子的能量只与入射光的频率^有关，而与入射 
光的强度无关. 

( iii ) 入射光的强度只影响光电流的强弱. 

这些实验结果，特别是 （ i ) 和 （ ii )， 无法用经典电磁理论解释， 
因为按经典电动力学，光是电磁波，电磁波的能量决定于它的强度， 
即只与振幅有关而与频率无关，而要释放光电子则需要足够的能 
量. 

爱因斯坦提出了 “光量子”概念，他认为辐射场就是由光量子 
组成，每一个光量子的能量与辐射的频率〃的关系是 

E = hu (5) 

他还根据他同年提出的相对论中给出的光的动量和能量的关系 
P= | 提出光量子的动量 p 与辐射的波长 A (= C / u ) 有下列 关系： 

⑹ 

(5) 与 （6) 称为普朗克-爱因斯坦 关系. 

采用光量子概念后光电效应中出现的疑难都迎刃而解，当光 
照射到金属表面时，一个光量子的能量可以立刻被金属中的自由 
电子吸收，当频率〃超过临界频率％时光量子的能量足够大，电 
子才可能克服脱出功4而逸出金属表面，逸出电子的动能为 

\mv^hu-A ⑺ 

只与〃有关，而不依赖于照射光的强度. 

至此爱因斯坦成功解释了光电效应.后来他还把能量不连续 
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的概念应用于固体中原子的振动，成功解决了比热容在绝对温度 
0 K 时趋于0的难题. 

从此,普朗克的量子论受到物理学家的注意. 

三、原子结构与玻尔的量子论 

J . J . 汤姆孙 （ Thomson ，1856 — 1940) 1896年发现电子后于 
1904年提出过原子 模型： 正电荷均勻分布于原子中而电子镶嵌其 
中.1911年卢瑟福 ( Rutherford , 1871一 1937) 根据 a 粒子对原子 
散射中出现的大角度偏转现象提出了原子的“有核模 型”： 原子的 
正电荷以及几乎全部质量集中在中心很小区域中形成原子核，而电 
子则围绕原子核旋转.这个模型能解释 a 粒子的大角度偏转，但遇 
到两大难题： （ i ) 原子的 大小： 找不到一个合理的特征 长度； （ ii ) 原 
子的稳定性问题：电子围绕原子核旋转的运动是加速运动，按经典 
电动力学，电子将不断辐射能量而减速，轨道半径会不断减小，最 
后将掉到原子核上去，原子随之斟塌.但事实并非如此. 

丹麦年轻物理学家玻尔 （ N . Bohr , 1885 — 1962) 1912年来到 
卢瑟福实验室,对原子模型很感兴趣.次年又有机会了解到原子线 
状光谱的规律，并找到了原子光谱与原子结构之间的本质联系，终 
于提出了他的原子的量子论. 

玻尔认为量子理论或许有可能作为描写原子结构的基础，因 
此也有可能充当原子物理学，光谱学和化学在逻辑上贯彻一致的 
理论图景的统一基础.这个统一图景的中心概念是分立的定态概 
念. 

他假定： 

(1) 原子能够而且只能够稳定地存在于与分立的能量 
( E U E 2 , …） 相应的一系列状态中，这些状态称为定态.因此原 
子能量的任何变化，包括吸收与发射电磁辐射,都只能在两个定态 
之间以跃迁的方式进行. 

(2) 原子在两个定态（分别属于能级和，设> E m ) 
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跃迁时，发射或吸收的电磁辐射的频率由下式 给出： 

hu = E n - Em (频率条件） ⑻ 

这里提出的定态、量子跃迁、频率条件都是玻尔很了不起的创 
见. 

玻尔再利用对应原理（大量子数极限下，量子体系的行为与经 
典体系相同)，求出了氢原子的能级公式，得出了可见光谱中的巴耳 
末 （ Balmer ) 系，红外波段的帕邢 ( Paschen ) 系并预言了紫外波段 
的莱曼 （ Lyman ) 系，获得巨大的成功. 

玻尔的理论也有困难，例如不能解释氦原子等的光谱，而且只 
能给出光谱线的频率而不能给出强度等等. 


四、波粒二象性与德布罗意波 

在光的波粒二象性和玻尔原子论的启发下，法国物理学家德 
布罗意 V . de Broglie , 1892 — 1987) 仔细分析了光的微粒说与 
波动说的发展历史，并注意到几何光学与经典粒子力学的相似性， 
根据类比的方法，于1923年提出 假说： 一切微观粒子都具有波粒 
二象性.他的思维逻 辑是： 对于电磁波，人们过去否认其粒子性，因 
而在微观领域出现了困难.当承认其波粒二象性之后，困难就解决 
了.那么，对实物粒子 （ m 笋0)，人们是否存在着相反的认识错误 
呢？人们过去从不认为它们还具有波动性，经典物理学在微观领域 
遇到的困难的症结是否就在于没有认识到粒子也具有波动性呢？ 
德布罗意假定，与一定 能量五 和动量 p 的物质粒子相联系的 
波（他称为“物质波”）的频率和波长分别为 


和 

A = ' - (10) 

P 

这两个公式称为德布罗意关系，相当于假定普朗克-爱因斯坦关于 
光子的能量公式 （5) 和动量公式 （6) 也适用于自由粒子.他提岀这 
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个假定的动机，一方面是企图把作为物质存在的两种形式 ( m^O 
的实物粒子和 m = 0的光）的理论统一起来，另一方面是为了更深 
刻地去理解微观粒子能量的不连续性，以克服玻尔理论带有人为 
性质的缺陷. 

1927年戴维逊和革末用一束具有一定能量和动量的电子射向 
金属镍单晶表面观察到电子衍射的现象，从而证实了德布罗意关 
系 A = VP 是正确的.后来，无数的事实都表明,不仅电子,而且质 
子、中子、原子等都具有波动性，波动性是物质粒子普遍具有的. 

仿照经典平面波,描述自由粒子波粒二象性的平面波，依（9)， 
(10) 在 r 处可写成 


^ = Ae 


i — i / t ) 


i 譬 (p.r— 


(ID 


其中 n 表示动量 p 的方向. 

少 称为自由粒子波函数，只能取复数形式. 


五、量子力学的建立 

量子力学是在1923年到1927年这段时间中建立起来的，两 
个彼此等价的理论——矩阵力学与波动力学，几乎同时被提出. 

海森伯 （ W . Heisenberg，WOl —1 97 6)于1925年提出矩阵力 
学,赋予每一个物理量以一个矩阵，关系式中出现普朗克的作用量 
子 h , 从宏观角度看 /I 是微不足道的，当 /I — 0, 矩阵力学中的量 
之间的关系将回到经典力学.矩阵力学成功解释了许多经典物理学 
的难题获得很大成功. 

薛定谔 （ E _ Schrodinger , 18 S 7 — 19 6 1)于 1926年提出 了描述 
物质波的波动方程，在波动力学中出现的是二阶偏微分方程，分立 
能级的问题表现为一定边界条件下解微分方程的特征值问题.随后 
他还证明了波动力学与矩阵力学的等价性. 

玻恩 （ M . Born , 1882 — 1970) 于1926年给出了波函数的概率 
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诠释，提出了概率波的概念. 

1927年海森伯提出测不准关系式. 

狄拉克 （ P . A . 1 VL Dirac ) 于1927年提出电磁场的量子理论. 
到此，涉及非相对论性的实物粒子与电磁场作用的问题，原则 
上都可以解决. 


六、薛定谔的波动方程 

对自由粒子的平面波 （11) 式分别对*和 

d 屯 

ih— = E^ 

一 = p 2 ^ 

d 2 d 2 d 2 


y ， 


式中拉普拉斯算子 v 2 


dx 2 dy 2 dz 2 


，而 ft 


求偏导后得 
( 12 ) 

(13) 

271 • 


对自由粒子， £ = 故得 

Zm 




1 = 一^” （ 14) 
当粒子处于外力场中，粒子的位势为 C /( r ) 时，其波函数少 ( r ， 
t ) 满足 


i h 


d ^_ 

dt 


2 m 


V 2 * f r + [/( r )^ 


(15) 


公式 （15) 称为 薛定谔方程， 它是量子力学的基本假定之一. 

波函数 ％ r ， i ) 是薛定谔方程的解，可以完全描述粒子的状态. 
波函数是复数，而陣| 2 具有实际的物理意义.因此波函数应满足一 
些带有普遍性的条件，称为波 函数的标准条 件:在 r 的变化范围内， 
少 ( r ， t ) 必须有限、单值和对 r 分量的一阶偏导数连续. 

可证这种波函数满足波的叠加原理，这是波的重要特征. 


七、波函数的概率途释 

电子究竟是什么东西呢？是粒子，还是波？电子既不是经典粒 
子也不是经典的波.也可以说，电子既是粒子也是波，它是粒子和 
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波动两重性的统一,但这个波不是经典意义下的波，粒子也不是经 
典意义下的粒子. 

电子所呈现出来的粒子性只是经典粒子概念中的“原子性”或 
“颗粒性”，即总是以具有一定的质量和电荷等属性的客体出现在实 
验中，但不与“粒子有确切的轨道”的概念有什么联系.而电子呈 
现出波动性，也只不过是波动最重要的东西 一- 波的叠加性，但并 
不一定与某种实在的物理量在空间的波动联系在一起. 

把粒子性与波动性统一起来的是玻恩.他在1926年提出了概 
率波，把微观粒子的“原子性”和波的“叠加性”统一起来.他认为 
德布罗意提出的“物质波”或薛定谔方程中的波函数所描述的，并 
不像经典波那样代表什么实在物理量的波动，只不过是刻画粒子在 
空间的概率分布的概率波而已.微观粒子呈现出来的波动性只是 
反映微观客体运动的一种统计规律性. 

根据波函数的概率检释，波函数 ^( r ) 满足 

J \^( r )\ 2 dr = 1 (16) 


的规范性条件. 

这样一来，波函数的物理意义是：表示微观粒子在 f 时刻 
出现在 r 处单位体积内的概率密度.量子力学在实际中的应用表 
明，这一解释是正确的. 

因此量子力学的波函数满足了同时反映波粒二象性的要求 .一 
方面，承认粒子是一颗一颗的，具有粒子性，这是粒子的最根本的 
内容; 另一方面，粒子在空间某区域出现的概率随而波动，可 
以解释干涉和衍射等波动现象. 

八、测不准关系 

在经典力学中，用坐标 r 和动量 p 描述粒子的运动状态，其 
他力学量都是 r 和 p 的函数.量子力学认为，微观粒子的运动状 
态必须用波函数 Hr , t ) 描述， r 和 p 只能描述经典粒子的粒子性, 
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不能描述波粒二象性. 

如果一定要同时用 r 和 p 描述微观粒子，则所得到的 r 和 p 
不能同时有确定值.这是1927年海森伯提出的 测不准关系式 

AxAp x ^ ^ (17) 

其中 Ax 表示坐标的不确定程度， Apa ； 表示动量在 X 方向的分量 
的不确定程度. 

测不准关系可理论证明，也有大量实验证明.测不准关系式指 
出了经典理论的适用范围.测不准关系式也否定了微观粒子的“轨 
道运动”.它也指明势能和动能不可能同时有确定值. 

量子力学表明微观物理世界的不确定性和使用概率概念的必 
要性，它扩大了概率论的应用领域，提升了概率论在科学中的地位， 
也极大地推动了概率学科的发展. 


教学札记之十七 I 



一、何谓随机数 

袋中放有10只外形质地等等完全相同的球，分别写上0, 1，2, 
• • • , 9等十个数字.从中摸出一球，记下它上面的数字之后放回，经 
充分混合后再摸一球记下数字之后又放回，……，依次进行下去， 
将记录下一串数字，这就是随机数. 

随机数可以看作服从下列分布列的随机变量《的独立同分布 
观察值： 



这个分布列称为从0到9的离散均匀分布. 
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通常把若千个随机数排成一组,若干组排成一行,若干行排成 
一页，若干页构成一张表，这就是随机数表. 

若把5个随机数排成一组并看作一个数，则它可以看作另一 
个随机变量77的独立同分布观察值，这里的 r ? 服从00000到99999 
的离散均匀分布. 


如果我们设想把小数点放在上述随机数的前面，又取足够多 
的位数以保证精度，则得到的随机数便可以看作服从[7(0, 1) 的随 
机变量 C 的独立同分布观察值.口头上或书面上出现的随机数多 
半就是这个含义,较准确的应称为 (0,1) 均匀分布随机数. 

上述做法太麻烦，不能满足实际工作对随机数的大量需求，因 
此就得另想产生随机数的新方法，不外数学与物理两种途径，近代 
则主要利用计算机. 


二、随机数的使用 

随机数的系统使用恐怕不到一百年.最早使用随机数的领域 
大概是抽样调查与试验设计，基本上都跟统计关系密切. 

1927年英国统计学家 Tippert 的《随机抽样数》出版，该书 
含41600个随机数，卜列成4个一组，每页有数行，计有26页，据 
说这些数字是作者从某些英国社会调査报告的数字中截头去尾拼 
接起来的.随后费希尔 ( Fisher ) 和耶茨 ( Yates ) 的统计表问世，其 
中有一个随机数表，含15000个随机数，是由20位对数表截取第 
15—19 位排列而成的 • 

英国统计学家卡尔 • 皮尔逊是最早利用随机数的人之一，他还 
指导学生们利用随机数计算在求统计量分布中遇到的重积分，得出 
很多结果，也是他鼓励 Tippert 搞出上述随机数表. 

蒙特卡罗方法的出现使随机数的使用进入一个全新的阶段.蒙 
特卡罗方法是20世纪40年代美国科学家在研制核武器的工作中 
为解决在瞬间内发生的复杂的物理过程的数值计算问题而发展起 
来的.战后随着计算机技术的迅速发展，蒙特卡罗方法也发展成为 
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一种功能独特的计算技术，可用来解决各门学科中的形形式式问 
题.该应用大体可分为三种形式：直接模拟，积分计算，动态模拟即 
马尔可夫链蒙特卡罗 （ MCMC )， 都需要产生大量随机数. 

三、随机数的产生 

一个随机数是指某些随机变量所取的某一个特定值，严格讲它 
只能用某些随机物理过程来产生.理论上不成问题，实际做起来困 
难很多.因此实际使用的都是“准随机数”或“伪随机数”. 

伪随机数是利用某些数学公式计算而产生的数列，它们能够 
通过随机数的一系列统计检验,主要是分布检验与独立性检验.统 
计学家早就提出基于概率原理的各式各样统计检验法，只要适当 
选用就可以. 

对于伪随机数产生器的基本要 求是： 良好的统计分布特性，高 
效率的伪随机数产生，伪随机数产生的循环周期长，产生程序可移 
植性好(譬如可在不同型号计算机上实现，与字长无关等).要求有 
良好的统计分布特性就是要能通过上述一系列统计检验，这当然 
是最重要的.现有的产生程序还没有一个是十全十美的，但许多都 
还能用，总之这也有一个不断探索、实践、创新的过程. 

最早的 t /(0,1) 伪随机数产生器可能是“平方取中器”，使用效 
果不太理想. 

如今比较流行的是同余产 生器： 

Xn - f-1 = ( ax n + c )( modm ) 

m 

其中称为种子（或初值)， a 称为乘子， c 称为增量， m 称为模，都 
是大于0的整数. 

用这种算法到某一次一定会得到以前出现过的数，这时序列 
进入循环，研究的目标之一是要找岀尽可能长的循环周期，这就要 
求仔细挑选模 m 和乘子 a 的最佳搭配.这时数论会有些帮助. 
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c = 0 的情况称为乘同余法，周期可能短些，但随机性会较好， 


因此可能用得更多.这时的递推公式为 


: r n +i = ax n ( modm ) 


一个被推荐的乘同余随机数产生 器是： 阿伦斯 （ J . H . Ahrens ) 
与迪特 （ V . Dieter ) 提出的 

^ mod 

p = 663 608 941, xo 为任何介于 1 到 2 32 之间的奇数 ， m = 2 32 . 

摘自 Dudewicz & Ralley . The Handbook of Random Number 
Generation and Testing with TESTRAND Computer Code . Ameri ¬ 
can Sciences Press . Columbus , Ohio , 1981, 

现在几乎任何一台计算机及其程序系统中都含有 U { Q , 1) 随机 
数产生器. 


四、任意分布随机数的产生 

应用中当然不止需要 C /(0,1) 随机数，而是根据问题的性质需 
要产生各种分布的随机数.幸而这里有一个统一的处理原则，而 
(0,1) 均勻分布是核心. 

正如《概率论基础》第三章§3关于均匀分布的特殊地位中 
所指出的，若0〜 t /(0， l )， 则 

卜 P ’ 1 ⑹〜作） 

其中 F { x ) 是任一分布函数，而 F - l ( y ) 是它的反函数. 

因此只要能产生 U (0, 1) 随机数，用这种逆变换法就能产生任 
意分布的随机数. 

例如，对指数分布 Exp ( A )， 

F ( x ) = 1 — e _Aj: , x ^ 0 
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这时 


因此 


ln(l — y) ， 0 彡 y 彡 1 


^ = —-r ln(l — 6) 

A 


由于 1 - e 与 0 同样服从 t /( o , l ), 还可以进一步简化为 


C = - T \ne 

A 


这个€服从 Exp (A). 

因此如果我们用乘同余法产生 TV 个 t /(0,1) 随机数, 
0 N , 则利用上式便可产生6, &，•_•，&，它们相互独立，均服从 
Exp (A) 分布，从而是 Exp(A) 的随机数. 

类似地，瑞利分布也可用此法处理，《概率论基础》 （ 3.3.42) 式 
正是这样做的. 

不过由于有些分布函数的反函数没有简洁的解析表达式或计 
算过于繁复，需要发明其他更有效的随机数产生器.正态分布就 
是一例.因此《概率论基础》中介绍的由博克斯-米勒 （ Box - 
Miiller) ，提出的变换法 （ 3.3.42) 及中心极限定理法 (5.3.15), 效率 
更高. 

总的说，对于常用的分布都已经有了特定的比较有效的随机 
数产生器，许多做法还跟抽样方法结合起来.这又是一个快速更新 
的领域，因此有兴趣或有需要的读者应参阅最新的书刊. 


教学札记之十 〆 、 ■ 


r 分布 


一、刖目 

r 分布 r(r ? A) 具有良好的性质和广泛应用，在概率论中占有 
重要的地位. 
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在皮尔逊1894年依微分方程导出的频率曲线族中已有 r 分 
布，属于 m 型.这个分布有形状参数 r 和尺度参数 A 可调节，能 
用来拟合各类实际问题提供的实测数据.例如在水文学中，皮尔 
逊 m 型曲线常用来拟合洪峰流量的历史数据，再作外推以估算“百 
年一遇”的最大流量，为工程设计提供依据. 

埃尔朗在电话系统设计的研究中也曾巧妙地利用了形状参数 
为正整数的 r 分布的-个性质突破难关，因此这种分布被命名为 
埃尔朗分布.这事件的梗概简介如下：实测表明，电话呼叫流很好 
地符合泊松过程，若再假定每次的通话时间服从指数分布（话务研 
究在大量场合也证实这点)，埃尔朗建立的电话交换模型导致马尔 
可夫过程，从而能导出排队长度、等待时间等重要变量的分布，问 
题得以顺利解决.但是若去掉通话时间为指数分布的假定，没有了 
“无记忆性”，问题难度立即大增.这时候埃尔朗想出用带正整数形 
状参数的 r 分布来描述通话时间，一是它可以表为若干个独立指 
数分布变量之和，从而化为多阶段服务而每阶段都保持马尔可夫 
性； 二是该分布可以拟合各种通话时间数据使模型的适用性增加. 
这样一来问题得到完满解决.在这类开创性的工作中埃尔朗成了 
排队论的先驱. 

当然人们对 r 分布有深刻认识是在对泊松过程作深入研究后 
发现埃尔朗分布可用来描述第 r 个到达时刻，它是前 r 个来到间 
隔（服从指数分布）的独 立和. 

二、埃尔朗分布与指数分布 

若以 W u W 2 r -, W n 表示参数为 Af 的泊松过程的第 
1，2 ,…， n 个到达时刻，记 


Ti = Wi 

T 2 = W 2 W\ 


T n = - Wn-r 


• 225 . 




则 n ， T2 , …， Tn 称为泊松过程的第 1 ， 2, …， n 个来到间隔， 

《概率论基础》第三章§ 1 已导出％ ， r = 1， 2, …， 服从参数 
为 r 的埃尔朗分布，特别地，的= n 服从指数分布，书中还指出 

W n = Ti + T 2 ~\ - hT n 

其中 TU 丁 2 ,… 相互独立，均服从指数分布 Exp ( A ). 这个结论 
的证明见教学札记之十二“关于两个等待时间分布序列”. 

三、正态分布， x 2 分布与 r 分布 

《概率论基础》的正文与习题对上述三种分布的关系有许多 
讨论,要点有： 

(1) 标准正态变量的平方服从 X ?分布，见第三章§3例 3. 

(2) xl 分布即为 r (|，*) ，见 (3.3.11). 

(3) n 个相互独立标准正态变量的平方和服从 X 纟分布，见习 
题三 *37 题. 

(4) x 2 分布具有可加性 (3.3.38) 即再生性 (4.5.29). 

(5) 多元正态分布与 x 2 分布的关系见 (4.6.21). 


四、随机变量的函数的独立性之一 


关于 r 分布,下面是一个刻画性的性质. 

命题一 若$与 r ) 相互独立，且 r ( n ， a ), n 〜 r (『 2 , 入)，则 


€ + 77与 f 独立. 

由 r V 分布的可加性知< + n ~ r( ri + r 2 , A )， 而 i 服从 


Fisher 


的 Z 分布 Z { r u r 2 ), 这是数理统计中一类重要分布. 
由于 Exp ( A ) = r ( l , A ), 因此有如下 结论： 


结论1若 《与 ry 相互独立，均服从 Exp ( A ), 则 （ + r ; 与 
相互独立. 

这个结论常以例题或习题的形式出现. 


V 
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由于 ； d = r ( y ) ，又有如下 结论： 

结论2若（与//相互独立，分别服从参数为 m 和 n 的 X 2 
分布，则《+ " 与- - —相互独立，《+ ”〜 Xm + n > 进一步可导出 

T"j TT1/ 

f ^服从 F 分布•见《概率论基础》第三章§3例 7. 

T) m 

以 r 分布为参照，以 x 2 分布为中介，可发现对正态分布也有 
相似的结论（虽然它不能由命题一直接推出 

结论3若标准正态变量 $与 V 相互独立，则+ T 7 2 与 i 

V 

相互独立，前者服从 xi 即 Exp 分布，后者服从柯西分布.见 

《概率论基础》习题三39 题. 

下面是结论3的一种更常见变体. 

结论4若标准正态变量《与 r ； 相互独立，则与 
arctan (|)相互独立，前者服从瑞利分布，后者服从分 

布.见《概率论基础》第三章§3例9,这是一个有名又有用的结 
果. 

顺便指出，结论3与结论4也建立了 xi 即 Exp 分布与 

瑞利分布的关系，而柯西分布与均匀分布的关系则在《概率论基 
础》第三章§ 3例5中早已建立. 

五、随机变量的函数的独立性之二 
下面是关于 r 分布的另一个重要性质. 

命题二 若$与 7 J 相互独立，且 《〜 rXrhA ),^ 〜 r ( r 2, A ), 

则 C + r / 与 t 4 一 独立.前者服从 r(n + r 2 , A )， 后者服从分布 

B{r U T 2 ). JaL 《概率论基础》习题三38题 • 

对照命题一及命题二不难看出0分布与 Z 分布有着直接的联 
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系，目前流行使用0分布而少用 Z 分布，因此后者逐渐从教科书 
中淡出. 

由于 Exp ( A ) = r ( l , A ), 因此有如下 结论： 

结论 5若 （与 r / 相互独立，均服从 Exp ( A ), 则€ + 7/与^ 

€ + 7 / 

相互独立，且《+ r ; 〜 r (2, A )， 而〜[/[0,1 ]• 

再由于 d = 又有 

结论 6若 《与 r ; 相互独立，分别服从参数为 m 和 n 的 x 2 
分布，贝 1 U + n 与相互独立. 

$ + ?7 

利用 X 2 分布作中介，也可建立正态分布的如下结论： 

结论 7若标准正态变量《与 r / 相互独立，则+ 7? 2 与 

^^ 2 相互独立,前者服从 X ! = Exp (|)分布，而月艮从 
分布,其密度函数为 

p ( y ) = — 

^ vy(i - y ) 

这是概率论中有名的 反正弦分布. 

由于 r 分布具有良好的性质，它又能包含很多有名分布作为 
特例，再加上有广泛的应用，因此目前它已成为概率论中仅次于正 
态分布、泊松分布与二项分布之后的第四个重要分布. 


教学札记之十九 I 

概率论公理化结构与测度论 

1933年科尔莫戈罗夫提出他的概率论公理化结构，虽然之前 
与之后都有人提出过概率论的其他公理化方案，但是时到今日，唯 
有科尔莫戈罗夫的公理化结构为一切数学家所公认，并写人各种 
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正式教科书.因为它实在太杰出了，无与伦比，不但给所有概率论 
概念予严格的定义，而且满足了各个学科对它的要求，在后来几十 
年发展中对概率论提出的新问题也都能在这个框架中进行研究.因 
此目前只要提起公理化概率论，都是指这个结构.《概率论基础》 
当然也不例外. 


科尔莫戈罗夫概率论公理化结构中，把事件定义成 a 域多中 
的元素，而概率 P 则定义为多上的规范化测度，从此概率论就与 
测度论紧密相关,如今世界各大学修读概率论的研究生恐怕很少有 
不读测度论的. 

因此要写一本理论上严谨的基础概率论教科书，想完全摆脱测 
度论是十分困难的，但是如果学概率论一定要先学测度论，或者把 
测度论的许多内容放在概率论中来讲，则会把大部分想学概率论 
的人排斥在外，而且用这种方式讲基础概率论也不大会成功.问题 
还是度的把握. 

《概率论基础》对这个难题的处理算是一种尝试.基本态度是 
不回避测度论，但也不炫耀测度论. 

《概率论基础》中概率论的基本概念如事件、概率、随机变 
量、分布、独立性、数学期望、收敛性等都有严格的定义，大部分 
命题都能讲得清楚，但是还剩下4处引用测度论结论而未加证明. 

为了做到这点，难点在事件域与随机变量的可测性，因为按 
《概率论基础》的体系，概率是经频率、古典概型、几何概率导入 
的，它的三公理的提出，水到渠成. 

事件域多是科尔莫戈罗夫公理化结构的核心，事实上把事件 
看作集合，把概率看作测度在之前的公理化尝试中早就有人提出， 
但缺乏事件域多并不成功.从当代随机过程理论中对事件信息流 
的倚重可见这种设计的高明，也是其他公理化方案所无法比拟的. 

在基础概率论中，事件域的落实主要是 R " 中的博雷尔点集， 
这是学生们在微积分和数学分析中所未遇到的，有点难度，经适当 
讲解也能接受. 
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《概率论基础》对这些都不回避，但只用细线条进行，对读者 
不苛求，也让教师能根据具体情况加以发挥. 

《概率论基础》中利用测度论结果而未加证明的4个地 方指: 

1. (3.1.2) (3.1.1); 

2. (3.2.2) => (3.2.3); 

3. (3.2.37) 的 证明； 

4. 定理 4.1.1 即佚名统计学家公式 (4.1.17) 的证明. 

关于1，《概率论基础》配置的习题三 *49,- 50题就是用来证 
明这个结论的,用的是测度论的标准方法.要学生自己想到这个证 
法是相当不容易的，但是写成习题的这种形式并加了提示，一般学 
生还是做得出的. 

关于2,只是把1的一维问题改成 n 维问题，几何上有差异， 
但从测度论观点看则无本质不同，因此上述证法只要稍加修改就能 
证出这一结论. 

1的证明已作为习题解答详细写岀，2就留给读者作为练习. 

关于3,对二维场合，要求 证明： 若 《与 r / 独立，则 


P{e eA,rjeB} = P{^e A}P{ V e B) 

Xt —切 成立. 

它的证明要困难得多.证明思路是先固定 S = (_ oo , y )， 对 
A 用上述测度论标准方法一次，说明对一切 成立； 再固定 
4 e ，对 s 也用一次标准方法，从而证明对 Be ^ u 该式成立. 
这个思路不是一般人所能想到的. 


进一步的困难是在第二次，即对 S 用标准方法验证 a 域的条 
件时，发现对相容事件的并，验证无法进行，遇到习题二18题所碰 
到的问题.幸而对不相容事件的并还容易通过，因此终于找到更巧 
妙的方法绕过这个 困难. 完整写出证明过程篇幅过长，因此就此打 
住. 


至于4,课文已经 指出： 在离散型场合，佚名统计学家公式 
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(4.1.17) 化为 (4.1.18) 


^9(0 = ^2g(xi)p(xi) 


只要写出的分布就能得到. 

而当 C 具有密度函数 h ( x ) 时， （4.1.17) 化为 (4.1.20) 

roo 

Ev = Eg {0 = g ( x ) p ^( x ) dx 


在 y = 3 ㈤ 适合变换法时（参看《概率论基础》 （3.3.12) 及 
(3.3.14)) 也可直接 证明. 

事实上，这时若令 y = g(x), $ =厂 My), 则 dx^\[g^ l (y)] f \dy, 
因而有 

rOO 

Eg(0 = Erj= l yp v (y) dy 

J 一 oo 

=[ yp^ia^iy)] \[9^ l (y)y\^y 


g ( x ) p ^ ( x ) dx 


可见这时 (4.1.17) 只是积分的变量变换公式. 

因此对离散型和连续型及其线性组合，佚名统计学家公式都 
是可以在微积分的基础上证明的.不过由于《概率论基础》的数 
学期望是用斯蒂尔切斯 ( Stieltjes ) 积分定义的，因此对一般分布函 
数，还是有必要对斯蒂尔切斯 ( Stieltjes ) 积分证明积分的变量变换 
公式（4.1.17)，或在更宽广的测度论的基础上证明它. 

科尔莫戈罗夫公理化体系还有其他成功之处， 例如： 

(1) 对条件概率与条件数学期望给出一种数学上严格的一般性 
定义，使能处理复杂的场合，例如当 P ( B ) = 0的情况等. 

(2) 证明只要有限维分布满足相容性就能对随机序列建立适当 
的概率空间，这为一般随机过程论及函数空间测度研究提供了必要 
的框架. 
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顺带说明，研究实值随机变量《时，使用的概率空间实际上是 
( R 1 ,^!, Pi (0), 其中概率测度 Pi (-) 由分布函数 F ^{ x ) 导出.这里 
要用到测度扩张 定理： 由分布函数 F e ( x ) = P { C < x } 可以确定概 
率分布 p 1 ( B ) = p{e eB } y Be ^. 

类似地，对 n 维随机向量 （匕， 6,…，心)，由 n 元分布函数 
F ( x 1? x 2 ,.-. , x n ) 可以确定概率分布 P n ( B ), B e 

测度扩张定理也在测度论中证明.《概率论基础》中没有明 
显涉及这些内容. 
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第四章数字特征与特征函数 


I 章前引言 


本章引入若干数字特征，它们以一个数值而刻画了分布的某 
一特征，在概率论及其应用中十分重要.最主要的数字特征是数学 
期望，方差和相关系数，它们都有深刻的概率涵义，书中用两组应 
用实例从多个角度来加以阐述.上述数字特征可用矩来概括. 

熵与信息量是信息论的核心概念，这里作了简介. 

特征函数（母函数作为其前导）与分布函数一一对应而具有更 
好的数学性质，是数学家们经过长期筛选才找到的处理概率问题 
的有力工具. 

以特征函数为工具对多元正态分布作了全面的处理，初步显 
示特征函数的威力，所证多元正态分布的诸多性质，可说是概率论 
的理论和应用中最精彩的内容之一. 


课文导读 


§4.1 数学期望 

用平均值来标志涨落水平，以中心化来对抗离散倾向，这是人 
类在长期实践中产生的智慧.概率论用数学期望来表征随机变量 
(或分布函数）就是一个很恰当的例证. 

学习本节，首先必须注意数学期望是如何定义的.书中分三步 
走，分别对离散型，连续型，一般随机变量定义数学期望.在离散 
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型场合，数学期望是随机变量的可能取值以取该值的概率为权作 
加权平均，有很明显的概率意义和直观解释.连续型受离散型逼近 
启发，数学期望定义为关于密度函数的一个积分.若把概率看作质 
量，则数学期望表征其重心.对一般随机变量也用离散型逼近，定 
义为对于分布函数的一个斯蒂尔切斯 积分. 《概率论基础》采用 
承认斯蒂尔切斯积分的若干性质，并说明这种积分的确能包含离 
散型和连续型为特例，用来定义一般随机变量的数学期望.这样做 
可把从积分论（在概率论教育中归入测度论,是其中的一章）节省 
下来的时间用来讲更多的概率论. 

其次,应记住重要分布的数学期望，并注意： （1) 它常有很直观 
的解释； （2) 它与分布的参数关系 密切； （3) 不少分布由它的数学期 
望唯一决定. 

第三，结合实际问题，认识数学期望的直观意义，并进一步理 
解引进数学期望这一概念对概率论的重要性.正文（尤其是应用实 
例）和习题都提供了不少典型问题，更希望读者举一反三. 

第四，要特别关心和注意“佚名统计学家公式”，这公式可能是 
概率论中用得最多的公式，但大部分都在无意识中使用.有不少人 
甚至不知道有这么一个公式，有些人则认为理所当然成立. 

假如你还不体会“佚名统计学家公式”的重要性,那么就请你 
证明数学期望的如下十分直观的性质： 

+ 7 ]) — E^ + Erf 

没有“佚名统计学家公式”（这里要用的是二维公式)，还真不知道 
要如何证明它！ 

上述性质称为数学期望的可加性(或线性性)，是数学期望最重 
要的性质，数学期望因它而得以在若干表征中心趋势的备择者中 
脱颖而岀.许多讨论因利用它而便捷，不少习题的解答因它而简化. 

§4.2 方差，相关系数，矩 

本节引进随机变量与分布函数的许多数字特征.其中方差表 
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征随机变量取值的离散程度，它与数学期望是最重要的两个数字特 
征，它们可以说是“天作之合”，联手构成“均值-方差理论”，通常 
就能对随机问题有相当深刻的描述；相关系数给出两个随机变量 
的线性联系 程度； 矩和分位数也表征了分布的重要特征. 

数学期望概念在概率论早期就产生，但方差等概念却出现得 
相当晚，跟统计学关系也更密切. 

对表征随机变量取值与其中心的偏离程度，方差是优胜者，主 
要是因为它便于数学处理，背后有很强劲的数学理论支持.但它的 
竞争者平均绝对偏差也有优点与潜力.想深人了解的读者可参看 
作者的另一本书（参考书目 [2]) 的第七章与第九章. 

学习本节，首先应记住方差的定义和它的计算公式（4.2.1)，还 
要记住重要分布的方差，并注意在它们的计算中一再使用佚名统 
计学家公式. 

其次，要记住方差的主要性质.性质4 (4.2.8) 是联系数学期望 
与方差的一个不等式，有重要后续应用. 

《概率论基础》为严格证明“方差为0的随机变量是常数”这 
一论断，提早引进了切比雪夫不等式.切比雪夫不等式的发现是概 
率论历史上的一个里程碑，从此俄罗斯学派在概率论中独领风骚， 
古典型框框被突破，随机变量，数学期望成为主要语言.关于该不 
等式在下章有更多叙述. 

相关系数 p 的引入该归功于统计学.从此对两个随机变量的联 
系程度中最简单的一种 一一 线性联系程度有了一个数量指标.不相 
关性大大弱于独立性，但等价于方差的可加性 D (^ + ri ) = D ^ + Dri 
与数学期望的可乘性五巧=五《 • 五7/，因此很重要.协方差的引进 
让方差阵成形，它与一元时的方差一样，成为多元场合的基本参量. 
《概率论基础》对相关系数的处理特别详尽，有异于别的教本.例 
如证明了相关系数在线性变换下的不 变性； 详细讨论了不相关与 
独立性的 关系； 从正态场合的特殊性讲到边际分布为正态而联合 
分布非正态 之例； 由二值变量的特殊性引入事件的相关性（参看教 
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学札记之二十三“事件的独立性与相关性”),还顺便讨论了抽样调 
查中的一个核心问题 

希望四个应用实例让读者对均值-方差理论留下较深印象，而 
条件数学期望，最佳线性预测一段则展示了这个理论的广阔前景. 

矩在极限理论和数理统计中都是最重要的工具之一，是概括性 
很强的一类数字特征，而分位数则提供了分布的另一类数字特征. 

顺带指出，在研究一个变量与另一变量的线性联系程度时，因 
为要考虑这两个变量变化是同向变化还是反向变化，因此具有符号 
的相关系数是主要指标，但是当推广到多个变量时，诸变量的变化 
方向无法统一，这时通常用决定系数 (coefficient of determination ) 
p 2 , 它才真正在线性变换下保持数值不变.在预测误差和回归中，真 
正出现的也是 P 2 , 见《概率论基础》 (4.2.65). 

§4.3 熵与信息 

本节给出信息论的一个导引，在概率论中讲信息论是少数派， 
但也有若干好处. 

为导出随机试验的不肯定性的度量，依照香农的思路先提出 
三条基本要求，从而导出表达式（4.3.5)，因它与热力学中的嫡表达 
式相同，也称之为熵. 

这样导出的熵的一些基本性质被证明，人们发现，用它作为不 
肯定性程度的度量是符合要求的.在此基础上，引进了信息量的概 
念并建立了信息论，称为香农信息论，这是迄今为止最通行的信息 
理论. 

连续型分布的熵被平行定义，也证得它的若干基本性质，并以 
之为工具证明了三种重要分布——均匀分布，指数分布，正态分布 
的特殊地位，即在不同的约束下具有最大熵. 

本节与全书完全独立，是否列入讲授大纲，可由任课教师自主 
决定 • 
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§4.4 母函数 


母函数显示出因有力分析工具的导入使得原本困难的概率问 
题得到容易的解决. 

母函数主要用于古典问题或离散模型.雅科布•伯努利制成一 
份等同于如下定理的 表格： 投掷 n 颗骰子能得到 m 点的方法数等 
于表达式 


(x + x 2 + rr 3 + x 4 + a: 5 + x 6 ) n 

中 a ；" 1 的系数.这可以看作是母函数法的肇始（参看《概率论基 
础》第四章§ 4 例 9). 

现代意义上，母函数是概率分布的一种变换，它把一串概率分 
布变成一个函数,而且是性质良好的幂级数，很便于分析处理.母 
函数犹如一只袋子把许多珠宝（概率分布值）放在一起，带进带出， 
随时取用，十分方便. 

母函数的优良性质与用途 包括： 

(1) 与概率分布一一对应，包含概率分布的全部信息，不像数 
字特征只保留部分 信息； 

(2) 便于求数字特征.若同时求一个分布的多个数字特征，则 
经由母函数简直是最速 途径； 

(3) 处理独立和的最好工具一把卷积化为 乘积； 

(4) 特别适合于处理随机个独立随机变量之和，参看教学札记 
之二十四“母函数与分支过 程”； 

(5) 用于证明若干离散型分布的再生性. 

在《概率论基础》中，母函数是作为下节要讲的特征函数的 
先导而安排的，教学中也可选择跳过. 

§4.5 特征函数 

概率论在研究极限定理过程中寻找有力的分析 T 具，最后找 
到特征函数有它的必然性.特征函数是分布函数的傅里叶-斯蒂 
尔切斯变换,而傅里叶变换是分析中最有力的工具. 
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有个有趣的讲法说，有人问英国人，如果要把所有书籍全部烧 
光只留一部书，要留哪部？英国人答道要留莎士比亚全集.假如向 
数学家提出同类问题，只许保留一种工具，那么答案大概是傅里叶 
分析 • 

傅里叶分析应用于许多数学分支，但着重点并不完全一样.在 
概率论中最起作用的是一个不很起眼的性质：傅里叶变换把卷积 
化为乘积.出发点是研究独立随机变量和的极限定理.从分布出发， 
正如《概率论基础》第三章§3指出的，遇到的是分布的卷积，简 
直无从着手,但一用傅里叶变换化为特征函数，则是再简单不过的 
乘积.一如从地面上走，要跨越崇山峻岭，大河险滩，步履维艰，为 
达目的地只能找航空器，解决升空，飞行，导航，降落等问题.本节 
就是做这类基础 T 作的. 

本质上，傅里叶分析涉及复变函数论，但在特征函数中，若善 
用欧拉公式# = cos 0 + isin 0, 则大部分问题都化为实的函数.经 
仔细处理，《概率论基础》（包括习题解答）基本上不用复变函数 
论，就能在微积分基础上顺利进行. 

本节有如下要点： 

(1) 特征函数对一切分布函数存在,分析性质特别 良好. 

(2) 特征函数与分布函数一-•对应.在绝对可积的假定下特征 
函数与连续型密度函数构成傅里叶变换对. 

(3) 《概率论基础》第四章§5性质3指出了特征函数的一个 
根本性质即非负定性（将在下章讲清楚). 

(4) 《概率论基础》第四章§5性质4正如前面所述，预示着 
特征函数在独立和的研究中起重大作用. 

(5) 利用特征函数可方便求取各 阶矩. 

(6) 记住重要分布的特征函数. 

⑺推广到多元场合，有些异同，为下节做准备. 

至此，把特征函数作为处理有限问题工具的基础性工作业已 
完成.在本节，牛刀小试，用于处理若干重要分布的再 生性； 下节用 
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于处理多元正态分布. 

为用于处理极限定理，尚需研究收敛性概念以及建立特征函 
数与分布函数对应的某种连续性，将在下章进行. 

§4.6 多元正态分布 


本节暂离叙述主线去完成一项十分重要的任务一 4究多元 
正态分布. 

正态分布是概率论中最重要的分布，而多元正态分布在多元分 
布中所占的份额还要大得多.“不懂多元正态分布就不能说懂得正 
态分布”——相信读过本节之后，你会信服这种讲法 • 

不懂多元正态分布，将来在数理统计与随机过程的学习中会处 
处遇见麻烦，笔者学生时代就遇见这个问题，因此有机会写教科书 
时就觉得非下功夫把这部分写好不可. 

二元场合在第三章已作推演，要推广到多元场合还要有新的 
工具.不外两条途径，一用矩阵论走代数的路，相对 初等; 另一用特 
征函数走分析的路，比较艰深，也处理得比较彻底.我们是为研究 
极限定理而引进特征函数并对它作详尽讨论的，并非专为多元正 
态分布而来，但到了这里当然就顺理成章用它作为工具来研究多 
元正态分布. 

用多元特征函数研究多元正态分布还有一个好处就是能处理 
退化的场合，在数理统计和随机过程中遇到的多元正态分布，退化 
场合并非罕见，所以更有研究之必要. 

因此本节的特点是用特征函数而非密度函数定义 n 元正态分 
布.国内后来出的教材也大都沿用这种讲法. 

之后的讨论沿着如下线索： 

(1) 边际分布仍为正态； 

(2) 数字 特征； 

(3) 不相关等价于 独立； 

(4) 线性变换下保持正态性不变 • 其中《概率论基础》中定理 
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4.6.6 多维正态变量的线性组合为正态变量的结论提供了定义与研 
究多元正态分布的一种新途径.另外，这段的有些讨论为统计学作 
了准备. 

(5) 把典型分解即《概率论基础》中（3. 2 . 23 )推广到多元场 
合,为回归分析作重要准备. 

多元正态分布是概率论与数理统计中最重要的多元分布，至少 
表现在以下三个方面： 

第一，它的常见性.多元正态分布在多元数据（多元统计数据, 
时间序列数据与随机过程数据）中最为常见，即使原始数据非正态， 
其平均值也很接近于正态（理由见下章要讲的中心极限定理). 

第二，它具有良好的性质.多元正态分布性质小结如下： 

⑴多元正态分布由均值向量与协方差阵完全决定. 

( ii ) 多元正态分布的边际分布仍为正态分布. 

( iii ) 多元正态分布的条件分布仍为正态分布，条件均值是线性 
函数，条件方差只与联合分布方差阵有关. 

(iv) 多元正态变量不相关等价于 独立. 

( v ) 多元正态变量在线性变换与线性组合中保持正态性不变. 

(Vi) 多元正态变量可经正交变换化为独立正态变量. 

第三,许多多元分布，例如多项分布,多元超几何分布，以它为 
极限.不少多元分布由它导出，例如对应于 X 2 的 Wishart 分布和 
对应于* 2 的 Hotelling T 2 分布. 

y 习题解晷与评注— ； 

L (1) 证明关于示性函数成立如下 公式： 

1^=1 一 1a; 1>4B = 1a*1b ； Iau 丑 =1 — b 

(2) 利用示性函数导出概率加法公式 (1.5.6). 

(3) 证明： I^ubuc = 1 a + 1 b + 1 c — Ias — Ibc — 1ca + Iabc 

(4) 证明： = 1 a +1 b +1 c — Iaub — Ibuc —1 cuv 4+1 aubuc 
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(5) 有五个队参加的比赛中，每个队与别的队都比赛一场，若 
每场比赛参赛双方各有50%贏的机会，试求整个比赛既没有不败 
的队也没有不胜的队的概率. 

(6) 证明4与 B 独立的充要条件为 1 a 与 Is 独立. 

解与证 （1) 提示： 用定义，作验证. 

⑵ Iaub = 1 — 

= 1 — ^ 

= 1-(1-1 A )(1-1 B ) 

= 1 a + 一 Iab 
EIaub = El a + EIb — EIab 

所以 

P{A UB ) = P ( A ) + P ( B )- P ( AB ) 

(3) IauBuC = 1a + IbuC — ^AB\JAC 

=l/l + 1 b + lc ^ IbC — - 1>4C + ^ABC 

⑷ lABC = 1 — ^AUBUC 

= 1 -( 1 X X AB - ! bC _ X CA +1 ABc ) 

=1 一 (1 一 1 a + 1 一 1 b + 1 — lc + Iaub 一 1 

+ lfluc — 1 + lcuA 一 1 + 1 — IauBuc) 

=1a + 1 丑 + 1(7 — 一 Ibuc—Icua+Iau 丑 uc 

(5) 记有不败的队的事件为总有不胜的队的事件为 B ， 则所 
求的概率为 P ( AB ), M 

Iab = ( 1 "" 1 a )(1 - is ) 

=1 一 1 a — Is + 
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现以 4 记第 i 队在整个比赛中不败，以汉记第 i 队 在整个 
比赛中不胜，则 

A = Ai U A2U A^U A4U A5, B BiU B^U B3U B^U 

因两队比赛总有一方胜一方负，可知当 i / j 时， PiAiAj ) = 0, 
PiBiBj ) = 0 , 且有 P ( AiBi ) = 0 , 于是， 

尸⑷= 户⑷） 一 P ^ A i ) + … = 5 x 占 

‘=i i^j 1 

5 

尸⑻ = 二 P(Bi ) -二 P(BiBj) + …= 5 x 占 
*=1 1 

p{ab) = ^ p{AiBj) ~"' = ( i ) G )^ 

故 

P(AB) = 1 - P ⑷一 P(B) + P(AB) 

= l _ l _ l + pV 4 N 11 

2 4 2 4 V 1 / \V 24 2 3 

17 
= 32 

⑹由 

^{lA = l , lB =0} = P ( ylB ) 

P{1a = OAb = 1} P(AB) 

P {1^ = 0,1 b =0} = P ( AS ) 

及 
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P {1 A = 1} = P ( A ) } P {1 A = 0} = P ( A ) 
P {1 B = 1} = P ( B) y P {1 B = 0} = P ( B ) 



可知 A 与 S 独立的充要条件即是 1 A 与 Is 的独立. 

【评注】示性函数一方面沟通了事件与随机变量，又能把事件 
运算化为数值运算，利于推导公式，另一方面又沟通了概率与数学 
期望，含意深刻，应用良多. 

2. 随机变量 /i 取非负整数值 n 彡0的概率为 Pn = ，已 

知五 M = %试决定 A 与 S . 

提示： 定木 B 使成均值为 a 的概率分布. 

答 A = e -a , B = a . 

【评注】规范化决定一个常数，均值也决定一个常数 • 

3. 设随机变量《只取非负整数值，其概率为 P 仪= *：} = 

n a >0 是常数，试求坟及代. 

(1 + a 广十 1 

提示： 代公式，求级数和. 

答 = a , = a(a + 1). 

【评注】答案按定义经级数求和可得出•但若觉察本题的 《服 
从《概率论基础》中提到的另一种（只记失败次数的）几何分布 

(3.1.22)， 参数 p =^^， 其均值为 f 方差为备，则可省去求和运 
算. 

4. 若事件 A 在第 i 次试验中出现的概率为 Pi ， 设 M 是事件 A 
在起初 n 次独立试验中的出现次数，试求及 

解记 


J 1，第 i 次试验出现 A 
\0,第 i 次试验出现 Z 


则 " = 《1 + • • • + €n ， 而石 6 = Pi ， = 巧 (1 一 Pi), 从而 


n 


五 /i = Pi, Dfi^ ^Pi(1 - Pi) 


【评注】把 // 表示为计数变量&之和，是这类问题的解题诀 
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窍 . 0-1 变量的均值、方差公式自当牢记. 

5. —袋中含有 d 只白球，6只黑球，从中摸出 cK ( c^a + b ), 
求摸出白球数 / x 的数学期望. 

解记 


fl , 第 i 次摸到白球 
10,第 i 次摸到黑球 


而 


所以 


E^i 


a 


a + 6. 



c 




a ca 
cl b a b 


【评注】利用数学期望的可加性，把 / X 作和式 分解； 概率计算 
用到抽签与顺序 无关. 用这种办法化解了题中摸球的前后相关性难 
题.本题实质是求超几何分布的数学期望. 

6. 试求： （1) 为收集 AT 张赠券中的 r 张所需购买的食品袋数 
^的数学 期望； （2) 为集齐水浒108将，平均要购多少袋？（参照习 
题一 38题） 

解 （1) 将收集齐第 j - 1张赠券之后到收集齐第 j 张赠券时 
所购买的食品袋数记为％，易知 


m+V2 + - \-Vr 


且％服从几何分布 
p {Vj = k} = (1 - 


fc — 1 


N — j + iy^N — j + 1 


Efjj 


N 

N 


N 


， fc = l ，2, 


N — j + 1 


， J. = 1 ， 2,…， r 


因此 


= Erji + . ■ • + Er] r = N ( — + ••* + — —-- - 

iV iv — r + 1 
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(2) 由 （1) 知，平均要购 


108 x 


1+ 2 + 


+ 



108； 


« 108 x ( Inl 08 + 0.577 2) « 568袋. 


其中 0.577 2是欧拉常数的近似值. 

【评注】和式分解，几何分布，数学期望可加性，利用这三招解 
决了这道难题.再用调和级数近似式，通过集齐水浒108将赠券所 
需购买袋数的数值计算，让学生得到一些感性 认识. 以上三道题显 
示了和式分解法在数学期望计算中的强大威力 • 

7. 试证： 若取非负整数值的随机变量《的数学期望存在，则 


k=l 


证 


oo oo oo 

k=l fc=l j=k 

j=l k=l 
oo 

i=i 

=E$ 


【评注】有趣又有用的一个公式.预示《概率论基础》 (5.4.49). 
8. 若随机变量€的分布函数为 F ( x ), 试证： 





[1 — F ( x )] dx — 



F ( x ) dx 


特别地，若纟取非负值，则 

= f [1 - F ( x )] dx 
Jo 
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•+oo 


证由议存在，得 W dF(x) 收敛. 故对任何 A > 0, 


A 


0 彡 AF(—A) < |x| dF(x) —— ► 0 ， A —> +oo 


即 


同样有 


于是 


Ei 


X 


lim xF{x) — 0 


注 1^[1 -刪 =0 


f+oo 

=I x dF{x) 

J —oo 

rO f+oo 

=I x dF(x) + x dF(x) 

J—oo Jo 

广 0 广 +oo 

x dF(x) — I : rd[l — 厂 ⑷] 


>o 


xF(x)|° -f° 




-oo 


F(x)dx 


+oo 

- X[l - F ( X )] 。+ 


rH-oo 

Jo 


1 — F(x)] dx 


r+oo 

Jo 


1 — F(a:)]dx 



F(x)dx 


【评注】所证等式可看作数学期望的几何解释.数学期望存在 
的充要条件是这两个积分同时收敛. 

非负场合的表达式可与上题 对照. 

9. 若随机变量纟服从拉普拉斯分布，其密度函数为 

p{x) = ^ e ^\ x ~^\/ x ^ —OC < X < CXD, A > 0 

试求取及叹. 

提示： 用定义， 算 积分. 
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答 = / x , = 2 A 2 . 

【评注】连续型与离散型各设直接计算题一个. 

10. 若分子的速度的分布密度函数由麦克斯韦分布律 给出: 

P(S 卜 \/1士哪（ - &)， S> ° 


其中 a > 0是常数，试求分子的平均速度和平均动能（假定分子的 
质量等于 m ). 

提示： 用佚名统计学家公式. 


答记分子速度为《，则平均速度五《=平均动能 



【评注】在气体分子运动论中是验证理论与实验的重要公式. 
11. 某城市共有 AT 辆汽车，车牌号从1到 AT , 若随机地（可重 
复）记下 n 辆车的车牌号，其最大号码为《，求 


解 


= = 


k n -(k- l) n 


k = 1,2,…， N 


Ei 


k: 


当 AT 充分大的时候， 

k=l k=0 

所以 


n -(k- l) n 

AT — 1 

k=l 

N n 

1 k n AT 
N N n 〜 

f x n dx = 
Jo 

,^ k n 

n ” 


k n 


n + 


JV n ~ n + 


fc= 


【评注】本题出现的概率分布已在《概率论基础》第一章§ 5 
例 5 算出.这里所得期望值公式很有用，而且可以推广到其他顺序 
统计量.此外，读者也可以对不重复场合作平行讨论. 
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12 •若 a 彡 《彡 6, 试证： R 并说明等式在何种情 


况下成立. 

证法一因 a < 《彡 6,所以 


D ^ = E [^ E (] 2 


a + bi 2 


^ E\b 


a + bi 2 (b — a ): 


方差表征随机变量的离散程度，所以当 P{C = a } = P{C = b } 

时 d 的方差达到最大,此时 

_ . _ ，o /_,. n2 a 2 6 2 /a + 6\ 2 (6 — a ) 2 

代= 砣 -㈣ H - （ T ) =^- 


即等式成立. 


证法二记 


€ 一 a 


，则0彡 rK 1， 


Drj = Erj 1 - (Erf ) 2 (Erj- (Erf ) 2 = Etj(1 - Eri) ^ 


从而 


=(b — a) 2 Dr) ^ 


( b - a ) 2 


等式成立充要条件， 


Eq = Er\ 2 = P{rj = 0 } = P{r] = 1 }=- 

【评注】证法一用到数学期望的极值性质.后半题考验读者对 
方差的涵义的理解. 

*13, 若&，6相互独立，均服从 N (^ a 2 ), 试证： 

Emax (《以 2 ) = ^ 

证设仍 = = &二上， 则仍， ％是相互独立的标 

(7 (7 
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准正态变量，且 


max (之 i ，（ 2) = max((T7/i +/x,crr/2 +//) = crmax(r/i,%) + fi 
记 X = max(77i ， r/2 )， 其分布函数为 

Fx{x) = P{max(r?i,7/2) < x} = < x,% < x}= [ 少 (x)] 2 

得 X = max ( r / i , rj 2) 的密度函数 


x 2 

O x "f 一 l 

Px ( x ) = 2 ^(x) (fi(x) = -J= e 2 J 一 -^=e 2 dt 


e 2 dt 


由此得 

Emsx(rn,r)2) 


xp x ( x)dx 


Ipxf 

冗 J 一 OO \ 


一 pX —\ 

e 2 e 2 dt I dx 


►+OO/ rx 


e ^ d < I d e 


1 r rx 

n 6 2 L 


e _Wrvd 


^ T x dx 


从而 

£ l max (( 1 ，《 2 ) = (7£ , max (77 i ,77 2 ) + /x = // 4- 

【评注】本题要旨是求随机变量函数之一的最大值的数学期 
望，上述解法中利用独立性先求最大值的分布，再对它求数学期望， 
相当于直接法.当然还有其他做法，例如利用佚名统计学家公式. 
亦可参看本章习题 *35. 

14•设/⑷ (0 < x < oc ) 是单调非降函数，且 /( a ;) >0. 
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对随机变量《，若五/(旧）< 00，则对任意 x > 0, P {\^\ ^ x } ^ 

m Efm - 

证记《的分布函数为 F ( a :), 

Pm > x }= J dF ( t ) 

\ t\^x 


^ j dF(t) 

^ W ) C m)dm 

= 7 ^ 聊） 

【评注】本题是切比雪夫型不等式之一，证明方法也类似. 
切比雪夫型不等式证明中，可如正文一样采用逐级缩小，也可 
像本题解一样采用逐级放大，殊途同归，实质并无二致. 

15.若… ，心 为正的独立随机变量，服从相同分布，密 
度函数为 p ( x ), 试证 

E f 6 + C2 ^ = k 

Ui+6 + -- + Cn ； ~ n 


Ci 


证 因， 

^1+6 + 

1，2, • • •，n 存在. 

由对称性 


< 1，故五 




^1 + ^2 +- 1 - C 


E\ 


《1 


• 6+."+6 x 


E 


《2 


‘6 +".+(n 


) 


■ E\ 




- l-Cn 


又 〆 gl+C2+ -+^nV 故 （ - ^ _ 

V 6+6 + + ，队 V 6+6 + -- + ^ 

E ( Ci + ^2 H - \~^k\ _ k 

\^1 + ^2 + • • • + Cn / n 


) ==士，从而 
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【评注】对正的随机变量 &,&，•••，&， 若满足某种对称性使 

_ Cl _ _^2_ _ Cn _ 

《1 +《2 -I -， ^1 + ^2 H - 《n ， ， Cl + ^2 H - H Cn 

有相同的分布，则结论就能成立. 

题中给定密度，是想让基础不太好的学生用积分式证明，但在 
概率论中较高境界是直接用数学期望的性质证明结论. 

16. 袋中装有 7 V 只球,但其中白球数为随机变量，只知其数学 
期望为 n ， 试证从该袋中摸一球得到白球的概率为 

证记^为袋中的白球数，4为摸一球得到白球的事件，则 

N 

= > : kP{^ = A:} = n 

fc =0 

N 

P(A) = ^P{^U = fc}PU = fc} 

fc=o 



1E kP{^ = k } 

k—O 


n 

= TV 

【评注】以本题为“引理”可以解决一大类古典概型的概率计 
算，见以下四题. 

17. 甲袋中装有 a 只白球6只黑球，乙袋中装有 a 只白球/5 
只黑球，现从甲袋中摸出 c ( c^a + 6) 只球放人乙袋中，求从乙袋 
中再摸一球而为白球的概率. 

解法一令 C 为 c 只球中的白球数， S 为从乙袋中再摸一球 
为白球的事件，则 C 取值0，1，2,…， C , 服从超几何分布， 且玫= 
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~^r (参看本章习题 5). 

a 十& 


P ( B ) = ^； P {^ = fe } P { S|C = A ;} 

fc =0 


= E p ^ = fc > 

fc =0 


a + k 
a + p + c 


a 


a + /3 + c 


E p {^ fc >+ 


fc =0 


a + /3 + c 


E fcP ^^ fc > 


a ；= 


- 1 -五£ 

a + 冷 + c a + /3 + c 

1 / ca \ 

a + /3 + c \^ a + 6/ 


解法二从乙袋摸球时，袋中有 a + /? + c 只球,其中有 a + C 
只白球.用上题结论（“引理 ”；) 立得 


P ⑻二 


a + 


ca 


d + 6 


a + /3 + c 


【评注】比较两种解法，可以看出，“ 引理” 正是由这类解题过 
程中提炼出来的. 

以后遇到这种问题，可放心直接写出答案. 

U 8. 袋中有 a 只白球&只黑球，每次摸出一球后总是放入一只 
白球，这样进行了 n 次之后，再从袋中摸一只球，求它是白球的概 
率. 

解记人为“进行 i 次后，再从袋中摸一只球是白球”的事 
件 ， i = 0， l ，2, …， n ， 则 

P{A^) = P(^)P(A + i|^) + PiA^PiAi^lAi) 


= P ⑷ P ⑷ + [1- P(Ai)] [p{Ai) + — 

= i 1 ^^Tb) p{Ai) + ^Tb 
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即 P ( Ai ) 满足差分方程 •. 

岸…卜卜土) p ⑷ =士 6 

解上述差分方程，得其通解 

P ( A n ) = C(l - + 1, C 待定 

由 P ( Ao ) = +可得 C = -- 所以所求概率为 

G + 0 (1 + 0 

【评注】本题也可以对袋中的白球的數学期望建立差分方程求 
解，其形式与难度大体与这里写出的相当.顺便提及，《概率论基 
础》第一章 §3 例 9 是本题特例，眼下我们所用的工具已不可同日 
而语， 

另外，对一阶差分方程亦可如习题二 32 题那样，导出递推公 
式，备各题引用. 

*19. 甲袋中有 a 只白球6只黑球，乙袋中有 c 只白球 d 只黑 
球,从两袋中各摸出一球，并交换放入另一袋中，这样做了 n 次之 
后，再从甲袋中摸出一球，求这球是白球的概率. 

解以不， V ；分别记第 i 次交换后甲，乙两袋中的白球数，易 
知足 + y ； = a + c ，EXi + EYi=a + c . 再设 


ri , 第 i 次从甲袋中摸出一只白球 
lo , 第 i 次从甲袋中摸出一只黑球 

ri , 第 i 次从乙袋中摸出一只白球 
lo , 第 i 次从乙袋中摸出一只黑球 


又有 Xi = + r/i - ^由16题的结论（即“引理”）还有 
Eii = = 1} = ^ i = P{7 7i = l}=^ 
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因此 


EX{ = EXi-i + Erji — E^i 


+ 

即 EX n 满足差分方程 


+ 6 c + d 


h) EXi . 


EX, 


- G -占 -丄) 


a + c 
c + d 


a + c 
c + d 


1 


7 a 


(a + c){a + b) 


该差分方程的通解为 

EX n — C^l a + & c + dJ ■ a + b + c + d 

其中 C 为待定常数，由初始条件 EX 0 = a ，得 
(a + c)(a + 6) ad — be 


EXn 


(i--l _L_r 

V a + b c + dJ 


a 十 b + c + d a + b + c + d\ a + b c + d 

EX n 


因而得交换 n 次后再从甲袋中摸出一球为白球的概率为 

a + c ad — be 人 1 


ct + 6 + c~hd (ci & )(d + 6 + c + d)V ci + 6 c d 


a + b 

r 


，即 


【评注】“引理”和数学期望概念的使用使本题解题思路变得 
十分清晰. 

本题比习题二32题难度也明显提高. 

*20. 现有 n 个袋子,各装有 a 只白球&只黑球,先从第一个袋 
子中摸岀一球，记下颜色后就把它放入第二个袋子中，再从第二个 
袋子中摸出一球，记下颜色后就把它放入第三个袋子中，照这样办 
法依次摸下去，最后从第 n 个袋子中摸出一球并记下颜色,若在这 
n 次摸球中所摸得的白球的总数为试求 ES n . 

解令 


fl , 从第 i 个袋子中摸出内球 
10,从第 i 个袋子中摸出黑球 
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则它的数学期望为 

而方差则为 


只及测量一次的 n 分之一，这就提高了精度. 


则 


p {^i = !} 


a 


由16题（即“引 理”） 得到 


a + b 


a 


a 


P {^2 = 1} 


a + b 


a 


ti + b + l cl b 


由此类推得 


P{^i = 1} 


a 




又 Sn = 《1 + 


a + 6, 

+《 n ， 所以 ES n = 


1 ， 2, …， n 


a + b 


【评注】几个 要点： 和式分解与数学期望计算，数学期望在古 
典概率计算中的应用（即“引理”)，递推法即差分方程. 

21. 在物理实验中，为测量某物体的重量，通常要重复测量多 
次，最后再把测量记录的平均值作为该物体的重量，试说明这样做 
的道理. 

答设 W 为该物体的实际重量，第 i 次测量的误差为测 
量值为 W + 6 i . 通常设== 0, = cr 2 , 且各 A 相互 独立. 

如果测量了 n 次，测量记录的平均值为 

-(W + W ^e n ) ==W + 




nE 〕 

11 n 


II n 


+ 


+ 


/^v 




Q 
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【评注】算术平均值的使用，历史久远.从概率论与随机误差 
理论的角度探讨使用算术平均值于测量数据分析的优点见于辛普 
森的文章，本题的解答显然注重于均值-方差模型的观点. 

•22 .若&，&，•• • 是独立随机变量，试找“权” 

n n 

ai ， <12 ,…， On (它们满足= 1), 使的方差最小 • 

i=l i=l 

n 

解若有某 a = 0,则取 afc = 1，其余 ai = 0,则此时 

的方差最小. 1 

若所有^ 一 0,则令 

n n 

/ (ai ， ^ • • ， a n ) = i) ( = > : of ^ 


n 

少 ( ai , •■•,〜)= ^ 2 叫 一 1 = 0 

i=l 

作拉格朗日函数 

n n 

厂⑷ ，…， a n ) = - 1) 


解得 

及 


dF_ 

da 、 


= 2aiaf + A = 0, i = 1,2 ，… 




A 



所以当 


di 


( T ： 


E 


时， dj ^ i 方差 最小. 
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[ 评注】答案是选权使它与方差成反比——完全符合直观, 


对上题算术平均值的情况作了推广. 

23. 甲与乙依下列规则玩随机游戏:甲从装有 i 个 i 号球 (i = 1， 
2,3,4, 5) 的袋中随机摸出一球放人密盒中，让乙猜号.乙对甲的支 
付是他猜的号码与真正的号码之差的⑴ 平方; （2) 绝对值.试对这 
两种场合，讨论乙应采取的最佳策略. 

解设甲摸出一球的号码为《，乙猜的号码为 C ， 乙的最佳策 
略是使平均支付最小，因此 

(1) 当 C =议时，- C ) 2 最小，故可取 

^ I 2 + 2 2 + 3 2 + 4 2 + 5 2 11 0 2 

=~1 + 2 + 3 + 4+— 5 = T = 3 3 

所以在每三次游戏中，一次猜3,两次猜 4. 

⑺当 <7为$的中位数时，£匕- Cj 最小，此时应猜 

C = 4 


【评注】主要用到如下 事实： 均值是最小二乘问题之解，而中 
位数是最小绝对偏差问题之解. 

不妨思考如下 问题： 在这两种场合，甲在每次游戏中应分别给 
乙多少支付才能使该游戏成为公平博弈. 

24. 某海港对停泊船只供给净水，初始价是每吨 a 元，以后再 
供则要加50%的附 加费； 若用不完造成浪费则每吨加收资源费 I . 

设某轮船的净水用量是密度函数为 KaO 的随机变量，为节约其用 
水总开支,试求其最佳首次供 水量? /. 

解设某船的初始供水量为2/，用水量为纟，费用为％则有 




— 2/)， 


i<y 
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于是有 


f ( y ) = Etj 


.V 


a 


a 


ay -y - -x p(x) dx 


•+oo 


3 ci t5ci i /v _ 
aj/+ yx- yj/jp(x)dx 


3a 


f y 


l^y-\ x )^ Ax 


*+oo 


3a 


，y 


x- ^y S jp(x)dx 


5 a 


•y 


y 


a 


、y 


p{x) dx — - xp(x) d: 
o 4 Jo 


*+oo 


3a f … ， 、」 a , 
+ y J xp ( x ) dx - - i/J 


+oo 


p(x) dx 


上式关于 y 求导， 


f \ y ) 


= 字 Jo p ( x ) dx + Y yp ( y ) - l yp ( y ) 


3a , 、 a 
^- yp { y ) - o 


_+oo 


a 




p(x) dx + -yp(y) 


^J o V p(x)dx-| 

7 i \ y ^ x ~\ 


_+oo 


p(x) dx 




令 /'( y ) = 0,则得最佳供水量应满足 f p(x)dx = 

Jo 7 

【评注】佚名统计学家公式应用之一例，问题的提法和解法既 
典型又新颖. 

”25. (Black-Scholes 期权定价公式）若股票价格知服从对数 

2 

正态分布，即 \ nS T ~ N^lnst + (r - y)(T-t), g 2 {T - t )), 

t < T. 试证明该股票的敲定价为 K 的买入期权的价格 
Ct = E[max(ST — 0)] 满足如下 Black-Scholes 公式: 
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Ct = St^ich) - Ke^ T ^(d 2 ), 其中 
1 2 

dl = aVT~=rA lri ^ + ( r+ y) (T_t) } ? ^^dr-crVT^i 

证因为办服从对数正态分布， 所以 S T 可表示为 

= 5 t exp|^r- ~^{T -t) + (ry/T-tZ 

其中 Z 〜 JV (0，1). 

ct = e- r ^>£?[max (S T - K, 0 )] 

= e w ( T —0 


E 


max s t e 


^^-~){ T - t )+ a \/ T ^ tZ ^ ~ K , 0^ 


e -r(T- 0 

r+oo 


max 


*oo 


: St exp {(r-D (r-Q+trv^b}- 尺， 0 


y /2 ji 


£ 

e" 2 dz 


只需讨论 


st exp < r 


|( r ~ ^~) ( T - 0 +<ry/T -tz\ ^ K 


应有 


故 


z 


2 

( r - 了 )(了 - 0 + cry/T — tz ^ln — 

- ( r _ S ) (r ~*)} 


记 


z 


a 


v ^ i{ ln f _ ( r ~ y ) (:r - <) } 
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从而 


Ct 


e -r(r- t) 

r+00 


}z m 

1 

z 2 

^dz 

f +00 

1 

4 

v^ e 


s t exp 


r 


cr " 

"2 


•)(T* - 1) + g\/Tl 一 t z * K 




2 f+OO 1 

dz - Ke~^l ^ 


zi 

e 2 dz 


= 5 t [1 — 步 (z* - ay/T^i)] - K e— r(7 ^) [1 - 少 (：•)] 
= St^crV^t - z*) - 


{ _ln f + ( r+ y) (T ~ t) }) 




= st ^( di ) - K 

【评注】当代数理金融学中最有名的 结果. 参看教学札记之二 
十二‘‘数理金融学和概率论” • 

26. 帕累托 （ Pareto ) 分布的密度函数为 


P (^) = 


{ 


rA 1 

0, 


/+ 1 ， 


x ^ A 
x < A 


这里 r > 0, 乂 > 0. 试指出这分布具有 P 阶矩，当且仅当 P < r . 
解设 （服 从帕累托分布，当 P < r 时， 

da : rA p 

x r - p+l r — p 


f-foo T P f+00 

E ^ p =i rAr ^ dx=rA ) A 


f +0 ° dx 

且由微积分知识容易知道，当 P 彡 r 时，反常积分 rf h 


发散. 

【评注】只存在有限阶矩的分布的 例子. 
t 分布是另一个典型 例子. 
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27 .若 < 的密度函数为 


p( x) = / 2\x\(ln\x^ 1x1 >e 

U ， 其他 


试证对于任何 a > 0, E|^| Q = oo. 
证 .… f + °° x a dx 


mr=J 


k +oo 


dx 


x(lnx) 2 


x 1 ~° c (lnx) 2 


因 


x 


所以 


lim — _ 

i 一 +oo x 1 ~ a (lnx) 2 x—+oo (lnx) 2 

r +o ° dx 


lim 

发散 . 


X 


a 


OO 


J e o: 1 *~ a (lna :) 2 
【评注】不存在任何矩的分布的例子. 

以柯西分布为代表的矩不存在之例，皆因“ 肥尾” 之故，在金 
融学的近代研究中渐受重视，因它们带来多次金融危机. 

28 • 若 € 服从 N(^(T 2 ), 试求一 其中 fc 为正整数 . 

解 1广+〜 




y/2na J-c 


\x — /i| fc e 


( x-nY 


dx 


令 tx 


X — fJL 


a 


，则 


m - ^\ k 


y/2na 

心 r 


•+oo 

a k \u\ k e 2 adu 

—oo 


- T 


u k e 46 du 


于是有 


E \^ - fi\ k 


{: 


^~a k {k~l)j + °°u k ~ 2 e~ T du 


a k (k-l){k - 3)... 5.3. 1 ， k 是偶数 
—A : 是奇数 
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【评注】很好的练习，重要的结果.正态分布存在任何阶矩. 
•29. 记叫= E \^\ k , 若 < oc ， 试证 < fc + > J / OfcTT , 
/c = 1,2, — , n — 1. 

证由柯西-施瓦茨不等式， 

即 

o>k ^ a/t-iajt+i 

从而 


a k k ^ a k-l a k+l 


取 fc = 1，2,…，且有 ao = 1，于是有 


af 

a | < °^ a \ 


a l k < H 

将上述不等式两边连乘， 

a? 制 … o^~ 2 af < alalala^al - - - 

= afa^a! …0^ 2 °* lo lfc+i 

则有 

ol k < d 

4 +1 以 +1 

所以得 *+>5^， A : = l ? 2,-..， n-L 

【评注】李雅普诺夫定理：作为 p 的函数是单调不减 
的.可推知：若高阶矩存在，则低阶矩必存在. 

30. 设随机变量6,《 2 ,… , Cm+n (n > m ) 是独立的，有相同 
的分布并且有有限的方差，试求5 =心+…+ 与 : T =心 +1 + 


• 262 - 




^ m - f 2 + … + Cm + n 两和之间的相关系数. 

提示：寻求公共点. 
n — m 


答 


n 


【评注】注意到 

^ = Cl + • • • + + Sm+1 +•••+€?! 

T = €m+l + - 1" (n + • • . + 《 m+n 

的公共部分为 ^ mH -1 + … + 

31 .若⑷ r ?) 的密度函数为 

p(x,y) = ( Jt 5 工切彡 1 
L 0， x 2 + y 2 > 1 

试验证 ：€ 与 77 不相关，但它们不独立. 

证 

广 +oo 厂 +oo 

= xp ( x , y ) dxdy 

J—cx> J—oo 




1 1 ry/\^X^ 1 

xdx I _ 一 dy = 0 

- 1 J — v ^ l ~ 兀 


同理，五 ” = 0. 




1 f \/l 一 ： 2 1 

xdx _ y— dy 

-1 J 一 y/X—X"^ 兀 


cov (^, Tf ) = E ^ T ] - E ^ Et ] 

即 《与 7/ 不相关.然而 

3\/1 ― x 2 , \x\ ^ 1 

，1工| > 


0 


f 2 

p e ( x ) = 1 71 


0 

2 


p v {y )= 卜 


\/i - y 2 , \y\ ^ i 
， \y\ > i 


即当 |®1 < 1，且 ly | < 1 时, p ( x ， y ) / P € ( x ) p f ? ( y ), 所以 ( 与”不独 
立 • 


【评注】由不相关性不能推出独立性的常用例证之一. 
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32. 某人写好 n 封信， 又写好 n 只信封，在黑暗中把每封信随 
意放入某一信封中，试求放对的信封数 M 的数学期望及方差 • 

解设 



第 i 封信放入了相对应的信封， 
第 i 封信未放入相对应的 信封， 




^ + ^2 H - 1" Cn 

可以算得 P {^ = 1} = -, 由此得说 t ? = I 又可以算得 

n n n 

嚇 = p {^ = 1 } = ^^rr 


D^i = - {E^) 2 = 卜 (;）=^( 1 -^) 

cov ⑷石） = E^j - E^j = -4 = n 2- ( ~-rT) 

于是就有 

Efi = £*^1 + •. • + E^ n = n x — = 1 

n 

和 

Dfl = D[^i + … + €n) 
n 

=Yl D ^ i+2 5Z cov (& ， 心） 

i=l 

=nX K 1 - S )+2 Q n2{ ^_ 1} 


【评注】匹配问题中的匹配数，其数学期望与方差均为1，与 n 
无关！习题一 *35 题中以泊松分布尸⑴为极限，所以这个结 
果实非偶然. 
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33. 设随机变量 C 〜 iV (0， l )， 记义= { |CI > 1 }, B = { 1 C | > 2}， 
试求 1 a 及 1 b 的概率分布列联表,数学期望，方差，它们的相关系 
数以及 + 


答 



EIb 


P Xa 1 b 


= 0.045 5, = 0.043 4; 

_ 0-045 5 - 0.317 3 x 00455 
VO-216 


= 0.320 4; 


D (1 a + Ib) = 0.322 1. 

【评注】解开一道浅显教值题，重溫几多重要老概念. 


*34. 若“ 服从二元正态分布 ，= a , = 1, 
Er } = 6, Dr ; = 1, 证明 ： $ 与 7) 的相关系数 r = cosgji , 其中 
Q = P{(^ - o)(v - b) < 0}. 


证法一由题设得 



e 


2(l'i r 2 ) [(^-a) 2 -2r(x-a)(y~6)4-(v-6) 2 


2 jiV 1 — r 2 J 

(x-a)(y-b)<0 


dxdy 


令 x = a + p cos 6^ y = b + psin 0, | J | = />, 



ny/l — r 2 


d 6 


•+oo — (1—2r sin 0 cos 6) 

pe dp 


to 
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vT— r 2 

r cW 

兀 j 

l§ 1 — 2r sin 6 cos 6 

r de 

Vl — r 2 

兀 J 

cos 2 汐 (sec 2 0 — 2r tan 6) 

dtan0 

y/1 — r 2 

兀 J 

f 1 + tan 2 9 — 2r tan 6 
「 d(tan0 — r) 

y/l — r 2 


晉 1 — r 2 + (tan0 — r) 2 

1 一 nn ~ r 1 

\/1 — r 2 / 

JC \ 

、 \/l 一 r 2 y/l — r 2 


arctan 


n 


•r 


Jt 


+ 


\/l — r 2 2 


于是得 


tan L 


V"1 — r 2 


cot qn 


r 


\/l — r 2 


由此推得 r = cos qn. 

证法二 

- 6) < 0} 
i rr 


2jrvl — r 2 丄 

(x-a)(y-6)<0 


_ 2 (!^ r 2 ) [(^-a) 2 -2r(x—a)(y-6)-f(y-6) 2 ] 

e dxdy 


u—x—a 
v=y—6 


令 x f 


2jiv1 

u — rv 
Vl — r 2 




e 


^ 77 y(u 2 -2rut;-f-v 2 ) 


dwdv 


uv<0 


，V， = V、 该线性变换将 ( U} v) 空间的直线 t; 


0 和 W = 0 分别映射为 {x\y f ) 空间中的直线 〆= 0 和 〆 



_ vr ^ x ^ 若记 tan 奶 = (其中 0 < g 彡 1)， 则直线 

一 7*2 、 

y f =- -—— x f — - tangjc - x 1 = tan(jx — qn ) - x \ ( u , v ) 空 | 司 

中的区域 uv < 0 在前述的变换下映射为 ( x \ y f ) 空间中的区域 
0 < y ’彡 tan(ji — qst ) - x 0 fP tan(jc — qn ) • x’ 彡 j/’ < 0 ， 



图 4-1 


于是延续上面的等式， 

m -«)( r /-6)<0} 


2 jiv 1 




2 ^r~P) (奴 2 — 2rw +v 2 ) 


tiv<0 


dixdt; 


X 


/ ii—rr; 

= 7 T ^ 

y f —v 


0^V 7 ^tan(n—(x’<0) 
tdLn(n—qn) x , ^y f ^0 (x^O) 




X / =pC 08 ^ 

y^psinO 1 
2 jt 


r r 

,0 Jji— gjf 






n S 1 r°o rO 一 

e pdpdO + — I I 6 2 pdpd^ 


■qn 


•( 

t 

Jo 


—4 


Q e pdp = g 


2, _ ^2 ^ 

由 tan qn = --- 可推得 r = cos qn. 


r 
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【评注】繁复的计算，简单的结论. 

•35 •设 ( e , r /) 服从二元正态分布 ， = Erj = 0 , = Dr ? = 1， 

= 试证 


证 


E max (^, r ))= 



max (《,”)=^ + V + \^~ V \) 


E max(^, //) = ■(£《 + Ev + E\^ - r/|) = ■五 | 《一 r/| 
利用多维正态变量的性质可知 f - r / 〜 N { 0 , 2(1 ^ p )), 所以 


邵1| 


\/2ji-^/ 2(1 — p) 


f+oo 

一 o) J 一 oo 


x 


\ x \ e 4 l p dx 


2 


►+oo 


x M 


^271-^/2(1 — p) Jo 


xe 4(1 -^ dx 


x m 


\/^(l - p) 2 


4(l-p) e -4(w) 


-foo 


0 



因此有 Emax (^ 7 )) = 

【评注】这里的解法利用正态变量在线性变换下保持正态性不 
变这一重要性质，做得干净利落，比本章习题 *13 的解法也更有普 
遍性. 

36. 甲袋中装有5只白球，7只黑球，3只红球，乙袋中装有4 
只白球，4只黑球, 7只红球.试问从哪一个袋中取出一只球有较大 
不肯定性？ 
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解 


丑甲 = 

- 15 lg 15 15 lg 15 - 

_ ^ lg ^ 

= 

= lgl5 — ^(51g5 + 71g7 + 31g3) 

15 

H 乙 - 

4,4 4,4 

= -l5 ig 15-l5 lg l5- 

士 4 


= lgl5 — $(41g4 + 41g4 + 71g7) 


因为 x\gx 为下凸函数，所以 ^(51 g 5 + 31 g 3) > 41 g 4, 则有//甲< 
H 乙， 故乙袋比甲袋有较大的不肯定性. 

I 评注】练习熵的计算与初步 应用. 

37. 试求几何分布的熵. 

提示：依定义再用期望值表达式. 

答 —lgp - Zlgg . 

P 

【评注】 考虑熵随 p 值的 变化 情况. 

38. 试求二项分布 的熵. 

提示： 代公式，求期望. 

答 - E (=) P k q n ~ k lg - nplgp - nqlgq . 

fc-- 0 

【评注】离散分布算熵仅举二例，读者可自造他例. 

39. 若以 a 及0分别记二^位信道的输入及输出，已知 a = 
1 } = p , P { a = 0} = l — p , P { 卢 = l|a = l } = g ， 
P { /? = 0 I a = 1 } = 1 — g , P { ^ = l|a = 0} = r , 
P {/? = 0 I a = 0} = 1 - r , 试求输出中含有输入的信息量. 
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解即计算 I ( a ^) = 啡)- H a ( 0 ). 其中 
H(0) = -[(l-p)(l-r) +p(l~?)] lg [(l-p)(l-r) +p(l-g)] 

一 [(1 - p)r + pg] lg [(1 — p)r + pg] 


Ha(P) = -(1 一 P)[(l 一 r)lg(l — r) +rlgr] 


-p[(l - q)\g(l - q) + qlgq] 


所以 


l(a,0) = (1 - p)r lg 


r 


(1 一 p)r + pq 


+ (1 — p)(l — r)lg 
+ p(l - 9) lg 
+ 列 lg 


( 1 - p)(l - r )+ p ( l _ g ) 
1-9 


( l - p )( l _ r )+ p ( l - q ) 

9 


{l-p)r + pq 


【评注】为计算信息量提供一例.第二章§1例4已讨论过这 
类信道. 

… 40 .在 12 只金属球中,混有一只假球,并且不知道它是比真球 
轻还是重，用没有砝码的天平来称这些球 .（ 1 ) 试问至少需要称多 
少次才能査出这个假球并确定它是比真球轻或重 .（ 2 ) 给出一种称 
球方案 • 

解 （ 1 ) 至少需要称 3 次. 

( 2 ) 将 12 只球分成三堆，分另 U 以 abed , klmn , wxyz 标识，以 a * 
表示第 i 次称量，其上标表示称量的情况. 

先将 afted 和 klmn 放置天平的两边， 

⑴ af cd = M ^ 表示第一次称,天平平衡，可推断假球在 wxyz M , 
将 tux 及 ya 放置天平两边， 

则可得 z 是假球.将 a 和 2 放置天平两边， 
的 > 2 ,则可知 z 比真球轻. 
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a a <\ 则可知 2 比真球重. 

a wx > ya ^ 可推断假球在扣叩里，将切， X 放置天平两边， 
则推断 y 是假球且较轻. 

^ > x , 则推断 t /； 是假球且较重. 

则推断 X 是假球且较重. 

ar < ya , 可推断假球在⑽: y 里，将奶，: r 放置天平两边， 
ar x , 则推断 J / 是假球且较重. 
ar x , 则推断 a ; 是假球且较轻. 
a -<", 则推断 tz ; 是假球且较轻. 

( ii ) a f cd > fcZmn , 可推断假球在 Med 或 Wrrm 里，将 a 6 A 及 cdl 放 

置天平两边， 

af fc = cd / , 则可得假球在 mn 中，将 m 和 n 放置天平两边， 
则可知 n 是假球且比真 球轻. 
a 『< n ， 则可知饥是假球且比真球轻. 

afbw ， 可推断 crffc 都是真球, a6 之一可能是假球且较 
重， Z 可能是假球且较轻，将 a ， 6放置天平两边， 
ar b , 则推断 Z 是假球且较轻. 
af > 6 , 则推断 a 是假球且较重. 

^ 3 <\ 则推断&是假球且较重. 

af k < cd \ 可推断假球在 cdfc 里，将 c , d 放置天平两边， 
« r d ， 则推断是假球且较轻. 

则推断 c 是假球且较重， 
a §< d , 则推断 d 是假球且较重. 

( iii ) otf cd < klmn , 此时可类似于 （ ii ) 情况操作和判断. 

【评注】称球问题是一个传播很广的智力游戏題，解法很多. 

它可用信息论的概念和方法 解决. 想进一步了解的读者可参看雅 

格洛姆兄弟合著的《概率与信息》. 

41. 试用母函数法求帕斯卡分布的数学期望及方差. 
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解帕斯卡分布为 


P {^ = k } 


f k-r 


r 


) p r Q k ~ r , A ; = r，r + 1， 


其母函数为 


k=r ' / 


S 


k 


令 m = A : — r , 


p (s) =p r Yl 


r m + r — 1， 


r 


q s 


m+r 




=0 


m + r 
r — 


「 V 



p r s r 

~ (1 一㈣ 


/^( l )=— 
V 


所以 


广 , ⑴ = 


r 2 + rq r 
P 2 V 


E 卜 P ， (l)=- 
V 


叹=/>"⑴+，⑴- [ P '( l )] 2 = p 

【评注】以帕斯卡分布为例，让读者计算一种分布的母函数并 
用以计算数字特征. 

帕斯卡分布的母函数在本章 §4 例 8 中曾由几何分布母函数 
导出，此处给出直接 推导. 

42.设€是一个母函数为 P ( s ) 的随机变量，试求下列各概率 
所对应的母函数： 
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(1) PU > n }； (2) P{C - 2n}. 

解 （1) 设 > n } Xf 应的母函数为 F ( s ), 依定义 

F ( s ) = X ) > n ^ n 

n=0 

且 

k=0 

oo oo 

= 尸代 = 0} + 乏二尸仪 > A : — 1}/ 一 f 尸{《〉 *}/ 

k=l fc=l 

=P{^ = 0} + 5 F(5) — F ⑷ + P{^ > 0} 

=S F(s)- F(s) + P{e ^ 0} 
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• M 3. 在伯努利试验中，若试验次数是随机变量，试证成功的 
次数与失败的次数这两个随机变量独立的充要条件是〃服从泊松 
分布. 

证 以 N s 记成功的次数，知记失败的次数，0 < p < 1为成 
功的概率.依假定 

nfAT I , P{Ns = a , i / = a 4 - 6} 

F { iV s = a |, = a + 6} = —— 

_ P { N S = a , jV F ^ 6} 

P{u = a + 6} 


r a + 6 > 


IpV 


P { N S = a , iV F = 6} 


f a + b y 


\ p a q b ' P{v = a + 6} 


充分性：若 1/ 服从泊松分布 P ( A ), 即 
一 •、 A a+6 


p{ … + &} = ^i e — 


代入 （*) 式得 


P{N s = a, iV F = 6} = (03 pV A - l 、 t e- A 


a \ b \ 


(a + 6)! 




故 N S 与 N f 相互独立. 

必要性：若仏与 JV F 独立，则 


P{Ns = a, Nf = b) — P{Ns — a} P{N F = 6} = /i ⑷仍 (6) 
由 （*) 式可知 

P{y = a-h6} • (a + 6)! = /i ⑷ fli(6) • a\b\p~ a q^ b = f(a)g{b) 

因此存在一个函数 / i ， 使 

h{a + 6) = f(a)g(b) 
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对一切非负整数 a ，& 成立. 

由题意， P 应有正概率取0值，由/(0) 5 (0) = F {^ = 0} > 0 % 

/⑼ 一 0, 5(0) # 0. 

在 （**) 中令 a = 0，6 = c 得 h(c) = /( O ) p ( c ), 又令 a = c , 
6 = 0,则又得 / i ( c ) = /( 咖 (0), 于是有 


/ i ( c ) = f( 0 )g{c) = f(c)g(Q) 


两边除以 f ( 0 )g( 0 ) n 

h ( c ) _ 9 (c) /( c ) A 

imo)-m = m =p{c) 

代人 （**) 得 


p(a + 6) = p(a)p(b) 

对一切非负整数 a , & 成立.记 p(l) = A, 推得 

p ( fe )- \p(k 一 1)= … = X k ^p(l) = \ k 


九⑷ = f( 0 ) 9 ( 0 )p(k) = f( 0 )g( 0 )X k 


P{^ = a + 6} = /(0) ff (0) 


入 a+6 


(a + 6)! 


由概率的规范化条件，得 


/(0) fl (0) = e~ A 


p { v = a + b} = (a + & )! e _ A ， a + b = 0,1 ， 2, ••• 

因此服从泊松分布. 

【评注】这里给出泊松分布的一种刻画，是直接取自论文的一 
道难题.《概率论基础》提供这一模型原型的内容 计有： 习题二 
43 题，习题三 17 题，第四章 §4 例 10 . 

*44 •设{心}是一串独立的整值随机变量序列，具有相同概率 
分布，考虑和 r / =心+心+…+ ^，其中1/是随机变量，它与{匕} 
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相互独立，试用⑴母函 数法； （2) 直接计算证明 

Er ) = Ev ' Egk , Drj = Eu - + Du - (£^) 2 

证 （1) 设^的母函数为 F{sl u 的母函数为 G ( s )， 贝 IJ 7?的 
母函数为 H{s)^G(F{s)). 

oo 

F ⑴ = [/>{ a = j}p = l 

j =0 

H\s) = G^Fis^F'is) 

H'\s) = G"{F{s)) [ 尸 , ⑷] 2 + (7 ㈣ ) ⑷ 

Er) = H f (l) = G , (F(1))F , (1) = G\1)F\1) = ■ E^ k 

D” =/f " ⑴ + fT ⑴ -[ 孖 , ⑴] 2 

=G”(1)[F ， (1)] 2 + ^(^^(l) + G f (1)^(1) - [(7(1) 尸 ， (1)] 2 

= G , (1)[ f ,, (1) + F , (1)- [^( l )] 2 ' 

» ■ 

+ [沪⑴] 2 [ G " ⑴ + G ， ⑴- [ G ^ l )] 2- 

► ■ 

=Eu - D^ k + Du - (Ehf 

oo 

(2) p{ v = j} = =+ … + & = = n} 

n—0 
oo 

=^2 P ^ V = n } 尸仏 + … + = j} 

n=0 


oo 

E ， n ^ Yl ^ p ^^ ^ 

i=o 

oo oo 

= ^}P{^1 + … + = j} 

j=0 n=0 

oo oo 

= 5 Z = X ^ 7 ^ 1 + ••• ~Kn = J *} 

71=0 J =0 
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=P{i/ = n) E(^i + • • • + fn) 

n—O 

oo 

= nP{u = n } E$k 

n=0 

=Ei/ • E^k 

oo oo 

Et ) 2 = = n}P{^i + ••• + ^ = j} 

j=0 n=0 

oo 

= E ^ = n } E(^i + … + Cn ) 2 

n=0 

oo 

=S P ^ V = ^ [ UE ^ + n ( n - 1 )( £ ^) 2 ] 

n=0 

oo 

=^ P{r = n }[ nD ^ + n 2 ( E ^ k ) 2 ] 

n=0 

oo oo 

= E nP ^ = n}D^k + [ n 2 P{v = n}{E^k ) 2 

n=0 n=0 

= Eiy . D^ k + Eiy 2 - ( E ^ k ) 2 

Dr ] - : Ei ) 2 — ( E V ) 2 

=Ev - D^k + Eiy 2 - (E “) 2 - (Ei/ • E^k ) 2 

=Ev - D^k + Du • (五 《 fc ) 2 

【评注】这是相当基本的两个公式 • 第一个很直观，第二个稍 
难.两法相较，母函数法在处理数字特征中显然方便得多. 

45. 某公共汽车站在 [0, t ] 中来到的乘客批数 M 服从参数为 
At 的泊松分布，而每批来到的乘客数是随机变量，来 n 个的概率 
为 Pn ，n = 0,1，2, _ • • ，试求 [ 0, < ] 中来到乘客数7?的母函数及数学 
期望. 
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解 w = + ••• + &• 

这里& 表示第 i 批来到的乘客数，其母函数为 


H 的母函数为 


故77的母函数为 


F(s)^ ^p k s k 
fc =0 

G{s) = A ( 卜 ” 


H{s) = G(F(s)) =e At(F(a) ~ 1) = e A d PfcS 、) 


H \ s ) = e xt{F ^ l) • XtF \ s ) 

oo 

Er)^ 丑 ’⑴ =A <F’(1) = A * • E fcpfc 

fc=i 

【评注】复合泊松分布 一例. 其数学期望为 Efi El 正如上题 

所述. 

本题以实际问题的形式出现，一些独立性假定蕴含其中. 

46. 试用母函数法证明二项分布、泊松分布与帕斯卡分布的再 
生性_ 

证二项分布 B ( n , p ) 的母函数为 (q + p $) n . 

若6〜 5( m ， P )， 6〜 B ( n 2 , p ) 且6与《 2 相互独立，则6 + 6 
的母函数为 (q + ps) ni (q + ps ) n2 = (q + ps ) ni ^ n 2 , 即表明+心服 
从 B{ni + n 2l p ), 故对相同的 p , 二项分布关于参数 n 具有再生性 • 
泊松分布 P (\) 的母函数为 e ^- 1 ). 

若《1〜 尸 ( Al ), 《2〜尸(入2)且 （1 与《2相互独立，则 （1 +《2的 
母函数为 . e Xx ( s - l ) = e ( Ai -|- A 2 )(3- l ) ? 故心 +《 2 〜 P ( Ai + A 2 ), 

即泊松分布成立再生性. 

帕斯卡分布 mr ， p ) 的母函数为 

\1 — qs / 

若6〜 /( fc ; n ， p )， 6 〜 /( fc ； r 2 , p ) 且 6 与 6 相互独立，则 
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6+6 的母函数为= (^-广' 故有 

\ 1 — qs/ \1 — qs/ W — qs/ 

共同 p 的帕斯卡分布关于参数 r 具有再生性. 

【评注】用母函数证离散型分布的再生性与用特征函数证一般 
分布的再生性可作对照. 

M 7. 若分布函数 F ( x ) = l - F{^x + 0) 成立，则称它是对称的. 
试证分布函数对称的充要条件是它的特征函数是实的偶函数. 


证若 C 的分布函数为 F ( x )， 则 
_P{ —之 < x} = P{^ > —x} = 1 — P{^ ^ 一 x} = 1 — F(—x + 0) 


因此€具有对称分布的充要条件是 《与 有相同的分布函数. 

充分性：若其特征函数/⑴是实的偶函数，即 /⑷ =m = 
/( -沐而 /(*) = Ee 以 ， /(-*) = 故《与有相同的特 

征函数,从而也有相同的分布函数,所以有 F ( x ) = 1 - F(-x + 0). 

必要性：若 F ( x ) = 1 - F(-:r + 0)，则€与\有相同的分布 
函数，因而 

f ( t ) = Ee {t ^ = Ee it{ ~^ = Ee ^ = /( 一 t ) =丽 


即《或 F ( x ) 的特征函数是实的偶函数. 


【评注】下列三事实等价： （1) 分布函数 对称； （2) C 与-《同分 
布； （3) 特征函数为实的偶函数. 

48. 试求 [0,11 均匀分布的特征函数. 


解 



e itx dx 


cos txdx + i 



sin txdx 


sin tx 


lo 


costx 
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所以 


sint 


• cost 




cos t + i sint — l 
— it 




t 一 0 
< = 0 


【评注】先求 1 2, 2」 

数，同样可以避开复变函数论 . 


特征函数，再导出 U[a ， b ] 的特征函 


M 9. 一般柯西分布的密度函数为 p ( x ) 


A 


n 入 2 + (x - ") 2 ’ 

A >0. 试证它的特征函数为利用这个结果证明柯西分布 
的再生性. 

证法一对于柯西分布的特征函数可用下法直接计算， 

A 


m 


e 


i tx 


ji A 2 + (x — fi ) 2 




e 


it (入 v+/x) 


Jt 


71 

2 

71 


e 


itfx 


e 


i\ tv 


e 


it/i 


l + V 2 

cos 入 tv 


l + V 


dv 


dx 


dv 




1 + v 2 


dv 


咖 r cosx ^ v dv 
Jt Jo 1+v 2 


问题归结为计算如下拉普拉斯 积分: 

f°° cosffx 

J= Jo rr^ 
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cLr, 0 = X\t\ ^ 0 



先证明 


oo 


oo 



oo 


e~ xy sin fix dx 


y 


P 2 


e 


•工 v 


cos (3x 


0 



e 


-xy 


cos /3x dx 


y 


6 2 


y 

P 2 + y 2 


y 


-^2 J e _xy dcos px 


这是因为 


e 




1^2 = J 0 e- xy sin y dy ， (x>0) 


广 oo 

xy sin 2 / dy = - J e^ xy dcosy 


一 e — 即 cosy 


•oo 


— x e~ xy cosj/dt/ 
0 Jo 


•oo 


x e~ xy d siny 
Jo 


1 一 xe^ xy siny 


〜 fV- sinydy 

o Jo 


1 一 x 2 e—sin y dj/ 
Jo 


1 + x 2 


此外有另一等式 


1 

e _a7y cos 0xdx = - e- xy dsin f3x (y > 0) 

m Jo 


n 

• TA 

s 

X 

e 

110 
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于是 




COS px 


dx 


1 + x 2 
cos 0xdx 


fo 


sin ydy j e 


ysmy 


dy 


e~ xy sin y dy 
— xy cos (3x dx 


y=0x{/3>O) 



x sin /3x 
l + x 2 


dx 


所以有 

dJ 

矿 

解此微分方程，得 */ = Ce ' 当故有 



回到柯西分布的特征函数，则有 


m 




。巾 广⑺呀如 

I +v z 


JT 
2 

—e — e 

ji 2 


JO 

P -入⑷ 


e 


i/i t—X |t| 


上述证明过程中涉及交换积分次序，交换求导和积分的次序， 
还有 J 关于参数/?的连续性，这些计算在理论上的依据可査阅微 
积分学中含参变量积分的内容. 

最后证明柯西分布的再生性.设6服从参数为 Ai 的柯西 
分布，《2服从参数为 M 2, A 2 的柯西分布，且6与《2相互独立，则 
/7 = 6 +6的特征函数为 

= e'^ 41 尤一入 1 ⑷ • 0*^ 2 i —*^2 \t\ = e i(Ml+M2) 卜 (入 1+ 入 2) 
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所以 r/ — Cl + ^2服从参数为 Mi + #2， Ai + A2 的柯西分布. 
证法二记 /(t) = e W-_， 易算得 


•4-00 


r+00 rO f+00 2 

\f(t) \ dt = = e Xt dt + I e~ Xi dt == — < 00 

•/ - oo •/ — oo J 0 


A 


由《概率论基础》定理 4.5.3, f { t ) X才应的密度函数 


P ⑷ 


•+oo 


2丌 J 一 


e -itx , e i M t - A|<| dt 



e — i(rc 一鋅 ) t 一入 |t|j 亡 


1 /*0 1 r-hoo 

2ji J-00 2tz Jo 

~ 2 ji ( A — i (: r — /z) + A + i(x — /i)) 

_ 1 A 

71 X 2 + (x — /x) 2 

再由唯一性定理知， /(t) 是 p(:r) 的特征 函数. 

【评注】利用拉普拉斯积分对柯西分布的特征函数给出了一种 
纯微积分的推导. 

利用傅里叶变换从密度函数求特征函数或从特征函数求密度 
函数是很有用的方法，这里给出一个例证. 

50. 若随机变量^服从柯西分布，/! = 0, A = 1，而 r; =(，试证 
关于特征函数成立着 


但是《与 r? 并不独立. 

证因 f c ( t ) = e-' f ^ t ) = e-l^ 所以 

h + v ( t ) = f 2 dt ) = e-' 2t ' = e 一 叫1 = 励 . m 
但显然《与 7； 不独立. 

【评注】对概率论而言，特征函数的性质4,即独立和的特征函 
数等于其特征函数 之积， 是最关键的性质.本题提供一个反例说明 
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其逆不成立. 

51. 设6,6,…，^相互独立且均服从同一柯西分布， 试证: 
+《2 +…+ 《 n ) 与 Si 同 分布. 

证记^的特征函数为 h k ( t ) = 则 

4 f ： “⑷=4 “ 0 = A o «)] n 

fc=l #c=l «=1 

— e i/x «~ A '^'j n = e iAit-A ㈨ 

这正是 6 的特征函数. 

【评注】柯西分布诸多“怪性质” 之一. 

这是泊松于 1827 年在研究观察误差中发现的，他比柯西在 
1853 年找到最小二乘法的反例时发现 “ 柯西分布”早 26 年！ 

52. 若《〜 N (^ ct 2 ), 试用特征函数法求 £(€ — 

解< -/ x 〜 AT (0， a 2 )， 其特征函数为/⑴=将/⑷ 
展开为麦克劳林 ( Maclaurin ) 级数 

/⑷ = e - K t2 




1 9 9 1 4 4 ( — l) n 

卜 r * + ^ at +，， * + M!! 


(7 2 n t 2n + - 


所以 

阶 # 严⑼ jW ( fc - l )!!， fc 是偶数 
= ~^- = \0 ， A 是奇数 

【评注】参看《概率论基础》 （ HU ) 式，也可参照习题四 28 
题. 

该级数也能用来证明正态分布的特征函数或分布函数由其各 
阶矩所唯一决定. 
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53. 求证： 对于任何实值特征函数 /(<), 以下两个不等式成立: 

卜 /㈤ <4(1-/ ⑷） 

l + /(2 t )>2(/ ⑹ 2 

以 F ( x ) 记其对 •应 的分布函数，因为/⑷是实值函数，所 


证 


以 


_ /(2 t ) 


2 


(1 一 cos 2 tx ) dF ( x ) 

> 

(1 一 cos tx){l + costx ) dF ( x ) 


彡 4 (l ― cos tx ) dF ( x ) 


•DO 


4(1 一 /( t )) 


1 + 刺 


2 


， 

1 + cos 2 tx ) dF ( x ) 

w 

cos 2 tx dF ( x ) 


-oo 


柯西， I 兹不等式 2 


( cos 


= 2(/ ⑷ ) 2 

【评注】两个有用不 等式. 与三角函数的倍角公式相连. 

*54. 求证： 如果/⑷是相应于分布函数 F ( x ) 的特征函数，则 
对于任何 a : 值恒成立 

7^0 ^ r \ r e^ itx dt = F{x + o ) - F{x - 0) 

证记 


, 1 r T 

lira — 

T—^oo 2 T J—T 

• T 




儿，，今 
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由于 p 办-叫=1,二重积分绝对可积，由富比尼 （ Fubini ) 定 
理可交换积分顺序，得 t 

记 

9^ y ) = ^ f T eit{y ~ x)dt 



2 cos t(y — x ) dt — 


sinT(y ― x ) 
T{y - x ) 




由此 | ff ( r ，2/)| 彡 1, 且 lim g(T,y) = { h X = y ，由控制收敛定理， 

丁—沈 10 , x^y 

/= r lim g(T,y) dF(y) = f dF(y) = F(x + 0 卜尸 (工 _ 0) 
J-oo T ^oo j{x) 

【评注】利用本题结论可由特征函数算出分布函数一切不连续 
点的跃度. 

55. 随机变量€的特征函数为/⑴，且它的 n 阶矩存在，令 

xk ^M^ logf(t) Lo^ k<n 

称； a 为随机变量 《的 fc 阶半不 变量. 

(1) 试证 r ; = € + 6 (6 是常数）的 fc ( fc 〉 1) 阶半不变量等于 

Xk\ 

(2) 试求出半不变量与原点矩之间的关 系式. 

解与证 （1) 由77 = e + 6 # f ^ t ) = ^ 

log /”( t ) = itb+log f^(t) 

:- id log /” ⑷ L _ :一 id log /#) 

1 ~"dT “ + 1 — "dr 

d * log /” ⑴— d k log f^t) , 

~~ ~~ ? AC>1 
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所以 € + 6 的 fc ( A : > 1) 阶半不变量等于$的 A : 阶半不变量 

Xk - 

(2) 设 （ 的特征函数为/⑷，它与原点矩有等式 

/ ⑻⑼ = \ k m k = i k E^ k 

則 = 1 + E 罟 ⑻ fc 

fc=i 

由半不变量的定义，又有 

k=l Km 

即 

/( t )= exp {^^( ii ) fc | 
fc —• 1 

k=l fc=l 

由 / ⑷的两个展开式得 

E 昔 ㈣ fe = f ： f(i 04 [f ； 晉⑼ T+... 

fc=l / c=l / c=l 

比较等式两边 A 项的系数，得 

爪 i=Xi ， rn 2 = X2 + Xi, = X3 + 3 xiX 2 + Xi 5 •… 

【评注】半不变量是随机变量或分布的另一类数字特征，它的 
特点是在平移下不变，不过这类数字特征目前已很少使用. 

56. 若随机向量 « ， 77) 服从二元正态分布 7 V (// i ，/ i 2 ，^ f ，4， P ) 
试写出： 

(1) ((，▽)的特征 函数； 

(2) + brj 的密度函数； 

(3) 当€ = x 时77的条件密度函数，并讨论 p = — 1 ， p = 1及 
p = 0 等特殊情况下结果的概率含意. 
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/Mr -v 1(/^山+/^2)+|(40+2^710^山+0^ 兰） • 
a (丄 Je 

, 、 1 2{a 1 al +6 2 <72+2a6pai(72) • 

\ f 7 lk \ Ja 1 o \ + b ^02 + 2 abpa \( J 2 ， 

1 ~2^(}- p 2 ) t - (妁崎 (" i ))] 2 

() ， 2jta 2x /l 二 〆 ’ 

p = -1， C 与 r ? 完全负相关，条件密度函数不存在， 

V =卩2 - -(X -/ ii ) 

^1 

p = 1，《与7；完全正相关，条件密度函数不存在， 

r / = ^2 + —( x -/ ii ) 

^1 

p = 0,《与 r / 不相关，推得€与 r / 独立，条件密度化为无条件 
密度， 

( y — #2) 2 
1 2 ol 

V 2 ncT 2 

【评注】关于二元正态的这些基本事实，应能熟练写出 • 

57. 若6，&，…，^相互独立，均服从〜(0，1),而 

n n 

Vl -^2 ak ^ k) ^2 = ^ 

fc=l fe=l 

n 

试证 r /1 与 772 独立的充要条件为 = 0 . 

证首先应指出 ( VUV 2) 作为 Ia ， …， 《 n 的线性变换构成 
二维正态变量. 又有 Em = 0 ,丑7/2 = 0 ,且 

n n 

Er ] iT ]2 = “) f y ^6 fcCfc ) 

fc=l k=l 

=^(y^QfcbfcCfc) + [(y^ajbfcgj^c) 

fc=l j^k 

n 

= 51 a k b k 
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卜 AT "， 


广 n(x-pc) 2 


I 评注】都是必须牢记的最基本结论.在统计学中更是常用. 
59•若(《，”)服从 i\T(/xi w?， 戊 i，P)， 而 

C/ = a 《十 &77 ， V + dr/ 

(1) 试求 t； 与V的数学期望，方差及相关 系数； 


所以7/1与％不相关即 Erj \ ri 2 = EriiEr }^ = 0的条件是 
y^afcbfe = 0 . 由二维正态变量不相关与独立的一致性知％与％ 

fc=i 

独立的充要条件为 ^ 2 a k b k = 0 . 

fcs=l 

【评注】这也是正态变量的一个刻画性 性质. 

58.设&，&,•••，&相互独立，具有相同分布 N (^ a % 试 

—1 I _，_，一 ，\ 1 • ^ k t . - ^ - ^ -r-Y ^ - ■ rrr _Iv. 


求之 


的分布，并写出它的数学期望及协方差矩阵，再求 


的分布密度. 

n ^ 


S (A—M): 


t 的联合分布密度函数为 -^~e 
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(2) 写出 (U,V) 的 分布； 

(3) 讨论 : 何种情况下， （ f/ ， V) 退化为一维分布 , 何种情况下， t/ 
与 V 独立 . 

解 ⑴ EU — a/xi + 6"2 ， DU = (j?g\ + 6 2 cr| + 2aba\(j2p 
EV = cfjLi + DV = (?a\ + d 2 a^ + 2cda\ G 2 P 


cov(C/, V) = aca\ + bd(j\ + (ad + bc)a\G 2 p 


acxr\ + bd(j\ + (ad + bc)a\G 2 p 

^ uv yJa 2 G\ + b 2 ^ + laboxG^pyJ (?o\ + (Pcr^ + 1cda\02p 


(2 ) 因 




，故知 （ t/, 10 服从二元正态分布 


N(EU, EV, DU, DV, p uy ), 其中的参数由⑴给出 . 


(3 ) 若记 



DU 

cov((/, v) 


cov(f/, V) 
DV 


则 


\ B \ =(ad - be) 2 ct\g\ — (ad — be) 2 c\(j\p 2 = {ad — 6c) 2 (1 - p 2 )of cr! 

因此当 a ， 6, c ， d 不全为零， ad = be ^ p = ±1 Si, (U } V) 退化 
为一维变量 . 

而当 acxxi + (ad + bc)a\a 2 p + bdo\= 0 H't, P uv — 0, V 独立 • 
【评注】本题提示如下要点 ：（1) 由线性变换下保持正态性不 
变断定 {U,V) 服从二元正态，从而把求分布等问题化为前两阶矩 
的计算而获得巨大 方便； （ 2) \B\^0 表示 (U,V) 退化； （ 3) P(/V =0 
表明[/与 V 独立. 

•*60. (Fisher 引理）若 Xi ， X 2 , … ， Xn 相互独立，均服从鄭， 
J 2 )， 记 



71 


E (不-习 

i=l 


2 


试证 : 

(1) X 与相互独立； 
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(3) 令 〜 XL 

证取正交阵 


A 


y/n 

1 

V 2 

1 

V ^2 


\ yJn{n—\) yjn{n—l) y/n(n—l) 


-(^ - 1) 
y/n(n-l)J 


记 = ( X u X 2 r -, X n ) y Y t = ( Y u Y 2 r ^ y Y n ), 且令 
Y = > LX ：， 则可知 

X 〜 Niji, a 2 I n ), Y 〜 N(A^ a 2 I n ) 

其中 / i T = (/ i ， 綷，…， / x )， J n 是 n 阶单位阵.于是 


fc=i 


Yk 〜 N ( O y (7 2 ), fc = 2,3 ,…， n 

且1\，1^，1^"，：^相互独立.又有 

nSl^±(X k -X ) 2 = ±Xl-nX 2 = ±Y^-Y^ 


(1) 


y 2 2 + if + … + y ; 2 

^=^ E x * = 4 n 


由 n 与 K，％， …， Fn 独立，可得又与纪 独立; 
(2) 由 Vi 〜 ^(^/n/ijO- 2 ), 推得 X 〜 JV(/i，一) 


丄 v^o o 

■ ■ ■ 

«•« 

■ ■ 9 

丄 AAll 

会 |工 
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⑶ 从昏装 4 可知 學〜“ 

【评注】这在正态总体统计学（近代数理统计是以它为出发点 
建立起来的）中是最核心的结果. 

i 习题总评 

第四章习题以计算数字特征——数学期望，方差，矩，相关系 
数为主，但很少配置硬算、死算的题目，更强调“活算”——主要是 
用有关性质作巧算.作者希望通过题 B 的精选和示范性解答能让 
使用本教材的学生学到更多这方面的技巧，也加深对这些数字特 
征的理解. 

对特征函数（还有母函数）只配置了适量的题目.它的威力在 
多元正态场合已见端倪，对它在极限定理中有力应用还在下一章. 

关于正态分布的一些题目都较重要,有关技巧应很好掌握. 

L 章后小议1 

本章引进分布的数字特征与特征函数. 

数字特征正如其名，只刻画随机变量或分布函数的部分特征. 
从研究分布函数转到研究数字特征看似退一步（不能得到变量的 
全面信息只能用其部分信息)，事实上却是别开生面.因为后者只 
用一、二个数就能抓住变量的特征，而前者则要用一个函数.何况 
所有有名的分布都只由一二个参数（它们与数字特征有紧密的关 
系）所决定.这个优点（所谓参数化）在从数据到模型（这是数理统 
计研究的主题）的转换中尤为重要. 

最主要的数字特征是数学期望，它表征随机变量取值的重心， 
还因为其他数字特征大都是随机变量的某种函数的数学期望.《概 
率论基础》从离散型岀发，直接利用斯蒂尔切斯积分，对连续型直 
至一般分布定义数学期望，并利用一组典型的应用实例来阐述数学 
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期望的直观意义，再通过佚名统计学家公式讨论数学期望的性质. 

佚名统计学家公式是概率论中最常用的公式之一，而且在使用 
它时常常感觉不到它的存在，真做到“润物细无声”.学完本章时, 
值得把全章检査一遍找出使用它的地方. 

对方差的直观含意的解释，相关系数既深且广的讨论，显示 
数学期望与方差连用的威力的应用实例，成为新版的一个特色. 

简言之，以平均对抗分散是概率统计的要义，均值表征中心趋 
势,方差则度量其误差. 

把熵与信息写入概率论教程不多见，聊备一格. 

特征函数在《概率论基础》中得到充分强调，这里深受苏联教 
材影响，但比起欧美教程主要讲矩母函数，优点明显多于缺点，因 
为后者不是对于所有分布都存在，因此不能真正解决问题.讲特征 
函数要用到复变函数，基础要求稍高，但经过仔细处理，书中并未 
用到多少复变知识. 

在展现特征函数的主要应用（下章用于研究极限定理）之前， 
用它研究了多元正态分布.因为国内早期概率论教本对多元正态 
分布只讲到二元为止，这在后继的随机过程和数理统计中完全不 
够用，自王梓坤《概率论基础及其应用》出版后，情况开始改变. 
《槪率论基础》不用密度函数而改用特征函数定义多元正态，从而 
包含了退化的场合，得出更一般的结果. 

母函数在《概率论基础》中安排作为特征函数的前导，并强 
调了对独立和的处理,这前后两节的讲述较多采用互见的形式. 

教学札记 


圣彼得堡悖论与期望效用函数 


一、 圣彼得堡悖论 

1703年俄国沙皇彼得大帝在波罗的海的沼泽地上建立起新都 
圣彼得堡.1725年彼得大帝去世由其妻叶卡婕琳娜继位，她在位短 
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短两年内就建立起圣彼得堡科学院，实现其夫夙愿. 

1725年10月27日瑞士伯努利家族第二代的尼古拉 • 伯努利 
(Nicolas Bernoulli , 1695 一 1726) 和丹 尼尔. 伯努利 (Daniel Berno ¬ 
ulli , 1700 — 1782) 兄弟作为应遨的外国院士到达圣彼得堡.次年, 
尼古拉提出了一个概率问题，此问题后以“圣彼得堡悖论”著称, 
在18, 19世纪非常有名.不幸，尼古拉到那里才八个月就死去，其 
职位由其弟丹尼尔继承.他继续研究圣彼得堡悖论，于1738年写 
成“风险测度的新理论注释”，提出自己的解答.此文由于对现代经 
济学的重大价值，200年之后由 Econometrica 于1954年1月译成 
英文在该刊当年第一期重新刊登. 

事实上，这个问题在1713年9月9日他们的堂哥尼古拉给蒙 
特莫特的私人通信中已经提出，被收入蒙特莫特的《随笔》. 

所谓“圣彼得堡悖论”可表述 如下： 

彼得掷一枚硬币，到掷出正面为止，这时该次赌博就算完结了. 
如果在第一次掷出正面，则巴维尔要给彼得一个 卢布； 如果恰好在 
第2次掷出正面，则给2个 卢布； 如果恰好在第3次掷出正面，则 
给4个卢布.一般地，如果在第 n 次掷出正面，则巴维尔要给彼得 
2-- 1 个卢布.问彼得在赌博开始时应付给巴维尔多少卢布才算公 
平博弈. 

这个问题后来受到丹尼尔，达朗贝尔，蒲丰，孔多塞，拉普拉 
斯，泊松，博雷尔等著名数学家的讨论.为什么这么多人对它感兴 
趣呢？ 

首先是因为彼得在游戏中的所得 X 的期望值是无穷大.事实 
上， X 的取值与概率分布为 

P{X = 2 n ^ 1 } = 2 - n ，n = 1,2,… (1) 

因此 

oo 

EX = ^ 2 n - 1 • 2 ^ n = oo (2) 

n=l 

世界上不存在有无穷财富的人.彼得当然没有无穷财富，因此 
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这个游戏根本玩不起 来. 况且为进行一个‘‘公平博弈”（这是自惠 
更斯《论赌博中的计算》以来深入人心的一个概念)，要先付出无 
穷财富才能开始，也是十分荒谬的. 

其次，属于心理学上的证据.有人作了测试，找来一批大学生, 
问他们为进行这一游戏愿付多少？大部分只准备付2至3卢布来 
玩这种游戏，个别人愿付到8卢布，但没有人愿付更多！ 

二、丹尼尔 • 伯努利的解法 

丹尼尔的解法建立在下述概念的基 础上： 人们对奖励所关心 
的是效用 ( Utility ) 而非货币 价值； 而额外的货币增加所得的额外 
效用随着奖励的货币价值的增加而减少.因此他作出特别的 假定: 
货币效用是货币奖励大小的对数函数，其函数形式为 

C /( X ) = 61 og - (3) 

CL 

这里 U ( X ) 是货币量； C 的效用， a , 6是正常数. 

丹尼尔认为，在确定圣彼得堡游戏的价值时，一个人会考虑由 
奖励所提供的效用而非它的货币量.因此他乐于为玩游戏所付的 
货币数量取决于游戏的期望效用，而不取决于期望货币报酬. 

在圣彼得堡游戏中，期望效用为 

00 1 

Eu m = j ： ^bio g -- 

n=l 
oo 1 

= E W 6 [( n — ” 1 % 2 — lQ g a ] 

n=l 


oo - 00 1 

= 61 °g 2 S - &lo s a 

n—1 n=l 

2 

— 6 log 2 — 6 log a = 6 log — （4) 

a 

因此这个期望效用等于 2 卢布货币的效用，即 EU ( X ) = £7(2)， 
由此 可得： 具有伯努利效用函数所表示的风险偏好的人只愿付2卢 
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布来参加圣彼得堡游戏.如果有一项确定性的可超过2卢布收人 
的选择，他将偏好这种确定性的选择而不管圣彼得堡游戏有可能得 
到无穷的货币报酬. 

丹尼尔把自己引进的期望效用也称 为道德期望， 并作道德解 
释. 

丹尼尔 • 伯努利在他的论文中还介绍了另一位数学家克拉默 
独立提出的类似的解法.克拉默也用效用的数学期望来解决悼论， 
不过他引进的效用函数是 

U ( X ) = Vx ( 5 ) 

针对这种效用函数，圣彼得堡游戏的期望效用为 

EU(X) = f2^^ ZT 

n=l 

⑹ 

因此具有平方根效用函数所表示的风险偏好的人为参加圣彼 
得堡游戏愿支付的最大价格 X 0 可以由方程 



对于丹尼尔 • 伯努利为解决圣彼得堡悖论所引进的道德期望 
概念，在同时代及后代的数学家中引起很多争论，有人赞同，有人 
则强烈反对. 


三、对道德期望的不同评价 

同时代的达朗贝尔 （1717—1783) 评论道：“我们不知道他的解 



是否令人满意，有些流言蜚语值得数学家重视 . ” 

蒲丰 （1707 — 1788) 在 1777 年的一篇文章中则提倡与数学期 
望平等地引入道德期望的概念:“一个守财奴和一个数学家相似，都 
只看钱的票值.一个明智的人，不在乎它的常规价值，只看他能从 
中得到多少效用.他的观点比守财奴合理，他的感受比数学家快活. 
被一个穷人用来尽法律义务的一撒勒和填充高利贷者口袋的一撒 
勒，在守财奴和数学家的眼中具有同样的 价值: 前者认为纳捐可取 
得‘等值’的乐趣，后者把它看成‘等值’的一个单元.但一个明智 
的人，将穷人的一撒勒评价为一枚金币，而高利贷者的一撒勒看成 
只值一分钱 •” 

贝特朗 (1822 — 1900) 在他的文章中挖苦说：“道德期望成了一 
门经典理论，这里的‘经典’是反义的.这门理论被研究、教授并在 
相当有名气的书上被描述，但是它的成功到此为止，没有实际的应 
用，没有做过什么切实可行的事情 . ” 

格涅坚科 （1912 — 1995) 在《概率论教程》的附录“概率论简 
史”中介绍了彼得堡悖论,但他说:“彼得堡院士丹尼尔 • 伯努利导 
入了所谓‘道德期望’这个概念.我们不来讲这个概念的定义了， 
因为它没有科学的意义，并且，我顺便说，它也不解决彼得堡赌法 
的奇论 . ” 

笔者从60年代起就相信格涅坚科的这段话，因为我的概率知 
识最早就是从他的书中学来的，直到90年代中期学习了西方金融 
理论才知道这个评价是欠公平的. 

四、效用理论在当代经济学中的地位 

经济学被定义为研究稀缺资源最优利用的科学，在当代被分 
为微观经济学与宏观经济学两大部分.近代主流微观经济学是所 
谓“新古典学派”，而主流宏观经济学是以凯恩斯为代表的有效需 
求理论还糅合进一点弗里德曼的货币学说.不过至今微观经济学 
与宏观经济学尚不能整合成一个系统的理论.这里我们的讨论局限 
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于微观经济学. 

20世纪二、三十年代以萨缪尔逊为代表的一批经济学家承继 
19世纪李嘉图-穆勒-马歇尔-瓦尔拉斯的传统，大量引进微积分、 
数理统计、线性代数等数学工具构建新的经济学，他们的目标是证 
明市场的自我调节会达到均衡,这是一种最有效的状态，能实现福 
利社会.总之他们的目的是论证市场经济制度是最好的经济制度. 

最后，在五、六十年代，以阿罗和德布鲁的工作为代表,他们终 
于在公理化的基础上完成这个架构. 

在这个理论中，市场经济即商品经济由三部分构成：消 费者， 
生产者与市场，因此其理论由消费者行为，生产者（厂商）行为，竞 
争市场的一般均衡理论（价格体制下）构成，再加上福利经济学作 
为辅助. 

消费者行为被描述为在预算约束下根据个人偏好作出决策，选 
购商品，达到效用最大化. 

因此在新古典经济学的消费者行为理论中，“偏好”是最基本 
的出发点. 


效用函数则是偏好的数量化.数 
理经济学为证明可用效用函数最优 
化以作商品选择，有非常严格而细致 
的讨论 • 

这样一来就可以建立起需求函 
数 D ， 配上从厂商利润最大化中导出 
的供给函数乂就能证明一般均衡的 
存在性（既决定价格 P ' 也决定了数 
量 Q *). 



图4-2 


这些理论构成数理经济学这一新学科，其数学工具也升级为凸 


分析和拓扑学. 
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五、 期望效用在不确定性经济学中的作用 

传统经济学假定消费者与生产者的决策所产生的结果是肯定 
而唯一的，这显然不符合实际，这就促使了不确定性下的经济学的 
发展.这种要求在投资过程和金融行业（银行，证券，保险）中最为 
迫切.事实上，不确定经济学的应用主角也是金融学，形成了金融 
经济学.任何投资都是以今日的确定性投入以博取明日更大的但不 
确定性的回报，这里就有风险，并且要求定量化一处理不确定性， 
目前概率论还是唯一合适的数学工具. 

金融学中的经济人称为投资者（买股票的人与卖股票的人都 
是投资者，证券公司、保险公司、银行只是中介机构)，因此投资者 
的行为是最需要研究的，而投资者的行为主要取决于他们对风险的 
态度.到目前为止，期望效用函数是解决这个问题的最佳良方.这 
样一来你就可以读懂丹尼尔•伯努利文章的题目了.我们也就不 
能不佩服丹尼尔在200多年前所表现岀来的远见卓识了.丹尼尔 
• 伯努利和克拉默的主要兴趣在于阐明期望效用优于期望货币值. 
特别地,他们证明了基于风险规避假设(等价于递减的货币边际效 
用)，期望效用方法既可用来解释人们购买保单，又可用于解决圣彼 
得堡悖论. 

下面我们将介绍现代效用理论. 

六、 期望效用函数与投资者行为 

投资问题面对不确定因素，最终收益是随机变量，它是 a ; 的函 
数.如果有两种投资途径，其最终收益分别是与 Y ( u ), 对某 
些 a ;， X ( u ) > Y { u \ 对另一些 u ;, 则可能相反.怎么比较，如何选 
择？ 

当代经济学家的解答是找一个效用函数 t /( x ), 再利用期望效 
用函数 EU { x ) 来作决策：若 EU ( X ) > EU { Y ), 则选择有更髙期望 
效用的 X . 



对于给定的效用函数£/,通过 [/ = 

C 定义无差异曲线，这样定义的无差异 
曲线①两两不 相交； ②两无差异曲线 
之间还有另一无差异 曲线； ③若 V 是 
x，y (两种商品消费量）的二元函数，则 
在坐标系中，右上的无差异曲线比左下 
的好.无差异曲线描述偏好，它们与预 图 

算约束线的切点确定了最佳（商品）选 
择. 

1944年 von Neumann & Morgenstein 出版《博弈论与经济行 
为》，这是20世纪影响数学与经济结合最重要的一本书，承继200 
年前丹尼尔 • 伯努利的创意在公理化的基础上建立了期望效用理 
论，证明了如果决策者的行为满足一组合理的一致性条件，期望效 
用可得出非确定性条件下的最佳结果，更详细地说，他们证明了效 
用可引入到决策问题上，以致那些基于期望效用作出决策的人等 
价于依照其偏好作出决策. 

七、效用函数与对风险的态度 

若投资者的效用函数为 ?70 r )， 则叉〜(^ 1 的期望效用 

\Pl P2) 

为 



Pi£^(^i) +p2U(x 2 ) 

而 X 的期望值五义=+ X2P2 = 其效用为 


U{p x xi +P2X2) 

若 

U(piXi + P2X2 ) > pxU ( xi ) + p2U ( x 2 ) (7) 

则称投资者为风险规避者. 

(7) 等价于要求效用函数 U { x ) 为上凸函数，即满足 U \ x ) > 0, 
U f , { x ) < 0. 
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若 


U{piXi +P2X2) <PiU(xi)+P2U(x 2 ) ( 8 ) 


则称投资者为风险爱好者. 

(8) 等价于要求效用函数 U ( x ) 为下凸函数，即满足 U \ x ) > 0, 
U 〃( x ) > 0. 

若 


fApiXi +P2X2) = PiU(xi) + p 2 U ( x2 ) (9) 

则称投资者为风险中立者. 

(9) 等价于 U ( x ) 为线性函数. 

上述讨论中起关键作用的是延森不等式，可参看《概率论基 
础》引理 4.3.2. 讨论中虽对二值变量进行，实可推广至取有限个 
值的普遍情况. 

值得说明,效用函数不唯一•若 U ( x ) 为效用函数，则 aU ( x )+ b , 
a > 0 可表示同一偏好. 

经验调查研究表明，绝大部分人是风险规 避者： 观其效用函数， 
首先， U f ( x ) > 0,这表明财富越多越好，人人 如此; 其次 U l \ x ) < 0, 
即表示边际财富效用递减——穷人多得100元比富人多得100元 
有用得多. 

边际效用递减是经济学中的一条基本原理. 

凡满足 U \ x ) > 0, U ff ( x ) < 0者为风险规避者，大多数人都是 
风险规避者. 

值得注意丹尼尔 • 伯努利所用的对数效用函数和克拉默所用 
的平方根效用函数都是上凸函数，而且他们对期望效用理论的解 
释与现代几乎一模一样，怎能讲“它没有科学的意义，，呢？ 

VV 、 确定性等价与风险溢价 

对于上凸效用函数，即对于风险规避的投资者,风险收益 X 的 
效用不如平均收益 I 的效用，见图 4-4. 这时可找到一个数 f ， 它 
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满足 f < $，但 

U{x^) - piC/(xi) + p 2 U(x 2 ) = EU(X) (10) 



图 4-4 

称/ 为随机收益 X 的确定性等价.称 7 T = 5 -: T * 为风险溢 
价，意思是只有额外增补 7 T 才愿参加该项有风险的随机 游戏， 即为 
达到公平博弈必须的补偿. 

举个例子，假如一笔款存银行到期可得1万元,而投资一个项 
目，期望所得也是1万元,则无人要投这个项目，除非另有补偿. 

一般地，若对一切财富 W 成立 • 

EU{W + X) = U{W + KX — tt) (11) 

则称 TT 为的风险溢价. 

Pratt 证明了 

P(X) U ff {w) 

〜 2 U f {W) 

阿罗证明了，对 X 〜 f 一 " h ) y 

\l-p pj 

1 h 

y 2 4 U f {W) 

Silt 一 ^^ 与风险、溢价成 : 正比，可作为风险的测度 • 
u f [W) 


( 12 ) 


( 13 ) 
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称 A ( W ) = -^1^1 为 绝对风险规避测度. 

称 R ( W ) = 为 相对风险规避测度. 

本教学札记介绍的内容为读者进人金融经济学所必备. 

教学札记之二-一 I 

现代投资理论和概率论 


一、前言 

现代投资理论是在马科维兹 （ H . Markowitz ) 1952年提出的 
证券组合选择理论的框架上发展起来的.1958年托宾 （ J. Tobin ) 
引入无风险资产并发现二基金分离定理.1960年代，威廉 • 夏普 
(William Sharpe ), 约翰. 林特纳 (John Lintner ) 和简 • 莫辛 (Jan 
Mossin ) 分别独立地建立了资本资产定价模型 （ CAPM )， 该模型用 
于描述证券的风险与期望收益率的关系，是测量风险、估价证券 
价值的基准和衡量投资绩效的标准.随后罗斯 (Stephen Ross ) 于 
1976年提出了套利定价理论 (APT). 这些模型用均值和方差分别 
描述投资中的收益和风险，并建立它们的二阶矩（即均值-方差) 
模型，使投资学在概率统计的基础上建立了自己的理论框架，并很 
快得到广泛而一致的承认，如今已成为行业的主要语汇，并指导着 
实际资本市场. 


二、证券组合选择 

1952 年马科维兹“组合选择” 一文在 Journal of Finance 上发 
表,这篇 14 页的论文是他的博士论文的摘要.马科维兹是芝加哥大 
学经济系的博士生，在校期间他参加了考尔斯经济委员会的工作. 
这个委员会由考尔斯 (Cowles) 家族资助，其创始人 A • 考尔斯是 
投资领域定量分析的开拓者之一，并创办了 Econoraetrica 杂志，几 
乎全美的诺贝尔经济学奖得主都曾在这个委员会做过研究，对经济 
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计量学和统计学在美国的发展做出过不可磨灭的贡献.马科维兹 
受到委员会两任主持人 Koopmans 和 Marschak 的指点，幵始以股 
票市场作为研究主题，并被介绍给当时的院长，金融学家 Ketchun ， 
后者指导他读当时最好的一本投资学著作，威廉斯的《投资价值 
理论》，该书的要点是所谓“红利贴现模型' 有一天马科维兹脑中 
“突然浮现一个观念，人们可能不只是重视报酬，同时也在意风险”. 
这样马科维兹抓住问题的 要害： 风险是整个投资过程的核心. 

当时费勒的名著《概率论及其应用> 第一卷刚问世，许多美 
国经济学家都是通过这本书熟悉概率论语言，并与此书终生为友. 

马科维兹把收益率 r 看作随机变量，假定投资者将追求期望 
收益率 f 最大化和方差 P 最小化的二元目标，把投资化为一个 
选择问题.从数学上看是一个在线性约束下的二次规划问题，这在 
《概率论基础》第四章§2例13中已有介绍. 

马科维兹的论文在博士论文答辩中遇到麻烦，著名货币学派 
创始人弗里德曼提出：怎么能对这样一篇不是经济学,也不是数学， 
甚至不是企业管理论文的作者授予经济学博士学位呢？——当然 
论文还是通过了. 

但是这篇论文发表后并未受到重视，直至另一位大经济学家托 
宾关注并邀请马科维兹到那时已搬迁到耶鲁大学的考尔斯委员会 
工作一年，在那里他写成一本书《资产选择一投资的有效分散 
化》，1987年又写成系统的著作《资产组合选择和资本市场的均 
值-方差分析》.但是总的说，马科维兹已把他的研究兴趣转向运 
筹学和计算机软件，因此当1990年被授予诺贝尔经济学奖时他本 
人也有点意外. 

50多年过去，马科维兹的理论已被演绎成很漂亮的理论，下面 
只能做最简单的介绍. 

三、最小方差组合与有效前沿 

基本假定： 单期、无摩擦、竞争市场.投资者对财富不厌足，& 
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越大 越好; 投资者规避风险，4越小越好.在《概率论基础》第四 
章§2例13中，投资组合问题归结为如下二次规划 问题： 

n n 

Wn a l = YlY. XiOCjO^ij 


n 

S. t ， 〉 二 j = Tp (1) 

i=l 


用拉格朗日乘数法可找到这个问题的解，单个称最小方差组 
合，全体称最小方差组合前沿，其上半段称为有效前沿——最好组 
合只需在有效前沿中寻找（图 4-5). 

在（％， F p ) 平面上的图形为 


c c 2 



其中 A S , C 是由 n 种证券的收益率 r l 3 ..., r n 的均值向量 
( fi ,---, r n ) 和协方差阵 ( a { j ) 所决定的常数，它们是这个问题的 
已知量.这是双曲线的一支. 

有了表达式就可对最小方差组合作很细致的讨论和得出许多 
重要结论，此处从略. 


四、无风险证券与二基金分离定理 

托宾提出应把无风险资产（国债，银行存款等）纳入投资组合 
这十分合理，而且把权益性股票与固定收益的债券一道研究，建立 
统一的证券投资理论也十分有益. 

无风险证券（利率为 7) 的引入使整个理论更加完满.这时新 
的有效前沿是从 7) 岀发的一根射线，它与风险资产的有效前沿相 
切于 T 点（图 4-6). 

这样一来，投资者为得到最好投资组合只需把资金在二个证 
券组合（一个是无风险证券，一个是切点证券组合）之间进行分配. 
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图 4 一 5 


图4 一 6 


至于如何分配,则与每个投资者对风险的偏好程度（用上凸效用函 
数表示）有关，利用无差异曲线与有效前沿相切来寻找最好组合. 
对风险很厌恶的人取 T 点左边的组合，这时无风险证券比 例大; 风 
险爱好者则甚至贷款来炒股,选择: T 点右边的组合. 

因此在有无风险证券存在的场合，无论投资者最终投资于何种 
有效组合 P ， 它在风险资产中各种证券所占的比例固定不变，恒为 
切点组合 r 的投资组合比例，因此切点组合 r 成为市场组合 a /. 
这就是二基金分离定理的最早的形式，也是最简单的形式，它可以 
推广到一般场合. 

事实上，在有无风险证券存在场合，分配给 n 种证券的资金份 

额々，…，: r n , 其和小于1，而1 - A - x n 则用于无风险证券， 

这时最优化问题表述如下： 

n n 

min (Tp = XiXjCFij 

t=i i=i 

n 

s . t . y^Xjfj + (1 — xi - - x n ) r f = f p (3) 

»=i 

用拉格朗日乘数法可得 

n 

Xxjdij = ri — ry, i 二 1 ， 2,…， n 
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这里 


入= 


f T^ r f 


g\ 


其中~及^4分别为切点组合 r 的均值与方差 - 
由上式可解出 x l 5 x 2 ,..., x n 以确定最好组合. 

以上对马科维兹组合选择理论作了近代表述.从中可以看出， 
这个理论兼顾了投资中所关心的收益与风险两大要素，对证券组合 
的分散化功能作出有说服力的说明.在一些基本的假定下可找出 
最好投资方案，理论和应用上都有重大价值 • 

进一步讲，马科维兹事实上建立了不确定性经济中投资者的 
行为理论，因此在他获诺贝尔经济学奖的演讲 中说: “至于他（弗里 
德曼）的论点的是非，此时我很愿意 让步： 在我答辩论文时证券组 
合理论不是经济学的一部分，但是现在它是•” 

顺带指出，马科维兹的双目标决策模型并不能完全纳入新古典 
经济学的理论框架，因此甚至马科维兹在上述演讲中也花不少篇幅 
来说明，如果适当选择效用函数,例如 l /( r ) = log(l + r )， 它与用下 
式表示的目标函数/(匕 a 2 ) = log(l + r )- 5 a 2 /(l + r ) 2 能得到近 
似相同的结论. 但是， 事实上，马科维兹的模型在实际运作中更切 
实可用. 

另一个问题是以方差作为风险度量，连首创者都存一定疑虑， 
但是半个世纪过去，方差作为证券风险的度量的地位，不但不动摇, 
甚至更稳固.试想在每天海量的证券交易记录面前，不用方差还有 
什么量更能度量“风险”.从另一角度看，如果有谁能发现一个比 
方差更好的度量随机变量离散程度的指标，岂不带来概率论的新的 
一轮大发展！ 


五、夏普的资本资产定价模型 

夏普在20世纪50年代是 UCLA 的学生，主修经济学也选修 
金融学.当他写完博士论文提纲交给新指导老师 Hirshleigh 时，这 
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位当时赫赫有名的教授一周后把论文退回并表示没有什么内容可 
言.夏普把这件事告诉他的另一位老师 Waston , 后者建议他找马 
科维兹谈谈.长久以来 Waston 一直是马科维兹著作的热情拥护者 
和传播者. 

当时马科维兹在 RAND 公司工作，该公司位于洛杉矶的圣莫 
尼卡，离 UCLA 不远.夏普找到马科维兹之后，发现他们的兴趣有 
交集.随后校方同意夏普的申请让他在马科维兹的指导下完成研 
究生学业. 

马科维兹深知自己理论的弱点，首先是计算量太大,对数目以 
百、千计的股票种类 n ， 要搜集它们的期望收益巧，特别是协方差 
阵 （叫) ，在20世纪50年代计算条件下根本无法完成，要及时解出 
方程（1)， （3) 也很困难.因此他一直在研究简化的模型，考虑到最 
好组合都只与市场组合 M 有关，因此他提出了 单因子模型. 这时 
夏普找到了他，从此之后，他就退居指导者的地位，由夏普把理论 
向前推进.夏普也的确作出重大贡献，不断有新的创意出来.更重 
要的是他一直在金融学领域执教和研究，写了几本很有影响的专著 
和教科书，对推广普及这套理论很有作用，因此当他在1990年与 
马科维兹同获诺贝尔经济学奖时，他的名气大得多，早就做过美国 
金融学会主席. 


下面来推导 CAPM (Capital Asset Pricing Model ) 模型 • 
改写⑷为 


Acov(r“ ^ 工=巧 一 ）， z = 1,2, •• - ,n (5) 

j=i 

或 

n 

ri = + Acov^ri, i = 1 ， 2 , …， n (6) 

所有最好组合都有相同的权: ci ， x 2 , …，〜，因此若以与4记 
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市场组合 M 的均值和方差，则 

n 

Et m =f M ⑺ 

i=i 

又 


故 _ 

r M — r f 

Ti=r + --^ cow{r u r M ) 

(9) 

^ r f +PiM(r M -r f ) 

其中 

-=( 10 ) 

(9) 是对第 i 个证券氏的收益率 n 的 CAPM ， 利用对 q 的 
线性性,可知对任何证券组合 p 的收益 r p , 均有 

f P = ^ f +PpM{f M -r f ) (11) 

其中 

cov(r p , r %/f ) 

0pM= M ’ (12) 

a M 

这是对一般证券组合 p 的 CAPM . 

(9) 表明，为让投资者购买第 i 种证 券叉， 它的报酬即收益应 
由两部分 组成： 其一是卩，相等于存银行得到的 利息； 另一部分是 

其中 T M - T f 表示市场组合的超额收益,它乘以 Am 
构成的第二部分 (3 iM (r M -r f ) 则是购买风险组合 M 因冒风险得 

到的报酬， Am 是证券 &与 M 的相关指标，称为/3系数. 

资本资产定价模型是一般均衡性理论，通过市场均衡给各种 
证券定价.业绩很差的股票价格会下跌，从而使它的收益率达到 
CAPM 要求的均衡值，业绩好的股票收益高，价格会上涨，这时购 
买它的成本上升，收益率会降到均衡水平. 
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资本资产定价模型主要由三个线性方程 构成： 

⑴ f p = r + T - M ~- Tf a p (13) 

J ctm 

称为资本市场线 (Capital Market Line ), 它表明市场组合 M 也是 
有效组合，所有有效组合均在射线上. 

⑻ f p =r f + P pM (f M -r f ) (14) 

即 （11) 式，称为证券市场线 (Security Market Line ). 如果单讲 
CAPM 的话就是指这条线，这时衡量风险的指标是久 

( iii ) ri - r f = ai +0 i M ( r M - r f )+eu i = l ,2 , …， n (15) 

其中设 ei ， …， e n 互不相关，均服从 N (0, a 2 ), cov ( r M , Si ) = 0. 

(15) 称为特征线，对每个公司可用实际资料估计叫， Am . 

对 （15) 两边取方差得 

+ ^ ( 16 ) 

它把每个证券的风险分成两 部分： 第一部分称为个别风险，第 
二部分虎称为市场风险或系统风险.个别 i 风险可通过组合分 

散化消除，而市场风险只对 Am 带来的风险提供报酬，而 

称为风险的市场价格. 

CAPM 是很实用的理论.这里不予详述. 


六、罗斯的套利定价理论 

1976年罗斯提出套利定价理论，这个理论有两大要素,其一是 
多因子模型，其二是套利定价概念. 

前已提及，是马科维兹最早研究单因子模型，后来夏普继续他 
的研究，他所称的“对角线模型”实际上也是单一因子模型.用单 
一因素（市场组合 M ) 来解释各个股票价格的变动过于粗略而且 
实用效果也不太好，因此罗斯提出多因子模型使理论有更大适用范 
围.顺便说，美国著名金融学家 Fama 数十年研究的结果最后推荐 
的是一个三因子模型. 
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套利定价的提出意义重大.罗斯在论文最后对套利定价理论的 
解释也引起许多讨论.不过我们将把套利定价理论放在教学札记之 
二十二“数理金融学和概率论”中介绍. 

罗斯讨论的模型是 

r * = a » + buFi + 6 » 2-^2 + • • • + bikFk + £ i y i = 1,2 , .•.，n (17) 

假定诸 q 互不相关，均服从 iV (0, a 2 ); 诸因素 F u F 2r ^ F k 也互 
不 相关; F , 与 q 也互不相关. 

在无套利假定下,结论是 

k 

ri = r f i = 1 ， 2,…， n (18) 

j=i 

其中\是风险因素 & 的市场价格. 

理论断言，承担一份风险就有一份超额收益,得到与 CAPM — 
致的结论.显然罗斯的多因子模型把单因子模型作为特例，但他研 
究的无套利定价与 CAPM 研究的均衡定价不同，因此两个模型互 
不包含， 

值得指出， CAPM 与 APT 均与线性回归关系密切. 


教学札记之二十二睡 


数理金融学和概率论 

一、从布朗运动到随机分析 

1900年巴舍利耶 （ L . Bachelier , 1870—1946) 在庞加莱指导下 
完成他的学院派博士论文《投机理论》，他率先使用概率理论，包 
括各种数学工具来解释股票市场的运作，而且占了整本论文约70 
页的篇幅.巴舍利耶的思想远远跑在时代前面.在金融方面，他不 
但研究股票还研究期货与期权等金融工具，提出它们的定价理论， 
还分析巴黎股票市场1894 —1898年的数据.在数学方面，他第一 
个提出了连续时间随机过程的概念，并研究了布朗运动.须知从物 
理学角度给布朗运动以正确定性解释和定量描述的是爱因斯坦于 
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1905 年发表的著名论文和 1906 年波兰物理学家斯摩罗霍夫斯基 
的论文.美国最有名的经济学家萨缪尔逊曾说，他详细读过巴舍利 
耶与爱因斯坦的论文并作比较，发现从各个角度看巴舍利耶的论 
文都更胜一筹. 

在巴舍利耶时代要严格描述随机过程，超前太多，虽然他的工 
作给出了马尔可夫性和切普曼-科尔莫戈罗夫方程，用4种方法证 
明分布的正态性，还证明方差为等非常深刻的结果，甚至用了 
反射法，但是数学上不严格或不正确之处也存在.在经济方面，他 
以正态分布描述股票价格，其取负值的可能性违背了 “有限责任” 
的原则，在期权定价中带来荒谬的结论.这一切的结果使他难以获 
得好的工作职位，该文在经济界被埋没几达60年之久. 


幸而数学界并没有忘记巴舍利耶的工作，从1918年起美国数 
学家维纳 （ N . Wiener , 1894一 1964) 建立了布朗运动的数学理论, 
因此布朗运动在概率论文献中有一个同样通行的名字——维纳过 
程.维纳过程和泊松过程是最重要的两种具体随机过程，是每一个 
研究随机过程的人所熟悉的. 

对布朗运动的进一步研究在法国本土由莱维继续.莱维是20 
世纪20〜30年代最有创意的概率学家，除了在古典中心极限定理 
和特征函数连续性定理中有重大贡献外,是他第一个把独立和与独 
立增量过程的研究结合起来，导致无穷可分分布律研究的完成，对 
布朗运动的深人研究和鞅序列概念的提出也是他的重大成就.莱维 
思想十分丰富，但他的表达很奇特，他的书常人很难读懂，导致后 
继无人.日本的伊藤清 （ K . It 6, 1915 — 2008) 受到莱维启发在1942 
年发明随机积分，后又发展随机微分方程，成为 It 6 微积分，是现 
代随机分析中最基础也最有用的部分.伊藤清因此获1987年沃尔 
夫数学奖，2006年更获第一届髙斯奖. 

鞅序列由伯恩斯坦首先系统研究，由 Ville 定名，最后由美国 
杜布加以发展成为系统的理论.战后法国梅耶到美国学回概率论， 
以他与杜布证明的杜布-梅耶分解为起点发展成现代鞅轮. 
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随机积分 1967 年由伊藤清的两位学生国田和渡边推广到平方 
可积鞅，并发展为现代随机分析.鞅和随机分析形成概率论重要分 
支. 


因此当经济学界重新发现巴舍利耶的工作，并用来建立金融学 
的近代理论时，发觉数学家早就为他们准备了充分的数学工具. 

现代普遍的看法是巴舍利耶 1900 年的论文同时创立了两个新 
学科——连续时间随机过程和连续时间金融学，而后面二者实际上 
是双胞胎. 


二、关于股票市场价格随机特征的大辩论 
1954 年美国统计学家 Savage 发现了巴舍利耶 1914 年的小册 
子，立刻寄发明信片给经济学家询问他们是否知道这个人及其工 
作.当时萨缪尔逊正着手探讨市场行为理论并构建自己的定价模 
型，在 MIT 图书馆找不到这本小册子却发现巴舍利耶 1900 年论 
文副本，从此经济学界知道了巴舍利耶的工作. 

概率方法进入金融学最基本的问题是：股价是否可测？ 

1933 年 A. 考尔斯在大量市场实际数据分析的基础上发表论 
文“股市预测指标能够准确预测吗？”结论是“这是值得怀疑的 
1934 年 Warking 发表一篇文章认为“价格变动倾向高度随机 
性”.他发现股价走势图与随机数产生的图形无法分辨. 

1953 年英 N 著名统计学家 M. G. Kendall 对 1928—1938 年的 
大量英国市场数据， 1883 — 1934 年芝加哥小麦月平均价格， 1816- 
1951 年纽约棉花资料作分析得出与 Warking 同样的 结论. 

1965 年萨缪尔逊发表论文“证明预期价格随机涨落”，同年法 
马 （ E. Fama) 用计算机分析市场数据发表 论文： “股票市场价格的 
行为”，都论证股价的随机性.之后出了一本厚厚的 Cootner 主编的 
论文选集 “The Random Character of Stock Market Prices” revised 
ed. 1967. 

最后由法马提出“市场有效假设” (EMH) (相当于“股票价格 
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的随机游动理论”）展开了至今长达40年的大论战，发表论文不下 
千篇.虽然很难得到完全一致的认识，但股票价格之难于预测恐怕 
是谁都否定不了的事实. 

正是这场大论战为当代数理金融学的建立清扫地基，复归巴舍 
利耶的论题. 

三、从几何布朗运动到期权定价公式 

为克服巴舍利耶理论在经济方面的困难，关键一步是用几何 
布朗运动代替巴舍利耶理论中的（算术）布朗运动.在离散场合，相 
当于假定股价变化率服从随机游动,这与 Warking 和 Kendall 
的结论完全一致,这样当用随机游动逼近布朗运动（见教学札记之 
九“随机游动三题”)，股票的连续收益率服从正态分布而股价则服 
从对数正态分布. 

采用了这个十分合理的假定之后，一切经济学的困难都迎刃 
而解：股价不再可能为负，期权定价不会出现无穷. 

接下来的开拓性工作由萨缪尔逊及其杰出的学生默顿 
( R . Merton ) 完成. 

Merton 原在加州理工学院学习应用数学，突然想改学经济学， 
便向各校发信，只有 MIT 要他.入学后系主任建议他听萨缪尔逊 
的课，从此他便成为萨缪尔逊的学生，后来成为助手，再后来成为 
合作者，最后他超过他的导师成为数理金融学的主要开拓者.关键 
之一是他掌握随机微积分. 

当时主要有两个问题：一个是最优消费与投资组合问题，考虑 
如何在预算约束下在一个时期内安排消费与投资组合，使效用达 
到最大.这个问题比马科维兹模型在两个方向有了扩充，一是既考 
虑投资又考虑 消费； 二是从单期模型到多期模型.最初是萨缪尔逊 
自己做（离散的）多期模型，后来便与 Merton 合作做更深入的结 
果，最后是 Merton 把它推广到连续时间模型，充分利用随机微积 
分,结果比离散场合简洁得多，成了 Merton 的重大贡献. 
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这个方向后由黄奇辅， Duffie 推广到多维扩散过程描述的证券 
市场，做出了许多重要理论成果.这部分由于太理论，太难，还没有 
找到有效的应用，后继研究者不多. 

另一个问题是期权定价 . C . W . Smith 1976年曾写过一篇文 
章对这个问题的前期情况作过评述.总的说，不少人（包括萨缪尔 
逊）接近答案但都有重大问题，直至1972年 MIT 的两个青年教师 
F . Black 及 M . Scholes 才解决这个问题，找到正确的公式，但是他 
们的文章发表不出来，知道他们结果而立即写出一篇更深研究结 
果的同事 Merton 只得也搁下来未发表，反而是一篇由前二人撰写 
的实证性文章在另一杂志提前发表，最后才是1973年两篇主要文 
章的正式发表.这个公式现称 Black - Merton - Scholes 公式，被认 
为是社会科学中应用数学获得的最高成就，不但理论上深刻，而且 
在指导着期权市场的每日实践. Merton 与 Scholes 因这个工作获 
1997年诺贝尔经济学奖， Black 不幸于前一年病逝， 

下面我们通过这个公式来介绍金融经济学的主要经济概念和 
所用的数学方法. 

经济概念包括：无套利假设，一价定律，风险中立定价. 

数学方法主要是 It 6 微积分， 

四、套利定价 

当代金融产品的定价分为两大类：一类是无条件定价，亦称因 
素定价， CAPM 及 APT 属于 此类； 另一类是条件定价，用的是无 
套利定价方法，期权与其他衍生金融产品的定价属于此类.本小节 
介绍后一类定价的经济学原理. 

1- 一价定律 

在一个竞争的市场中，如果两个资产是等价的，它们将有相同 
的市场价格. 

一价定律通过一个称为“套利”的过程来实现，即利用差价， 
以低价买进并立即以高价卖出等价产品，以锁定一个确定性的利 
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润而不冒任何风险.这时低价的必涨价，高价的便跌价达到一价为 
止.这是 MM (Modigliani - Miller ) 定理的要点. 

一价定律是金融学中最基本的定价原则. 

推论 利率是单一的. 

推论2: 股票在不同地点是同一价格的. 

2. 套利机会 

套利机会 A : —项资产在时刻0得到正的收入，但不带来将来 
的盈亏，则称有 A 型套利机会. 

市场不应有套利机会 A ， 因此有如下推论： 

推论 1:价格是线性的. 

推论2: 若 Xr = 外，则 p { X t ) - p { Y t \ 0 < * < r ， 即一价定 
律. 

套利机会 —项资产，在0时刻费用为0,但将来所得 X ，满 
足 P { X 彡 0} = 1， P { X 〉 0} > 0,则称有 B 型套利机会 • 

满足上述两式的资产 X ，称为有 限责任资产. 股票，债券，彩 
票等均是有限责任资产. 

推论 3:有限责任资产其价格为正. 

占优定理: 若 x 彡 y , 则 p(x) ^ p{Y )； 若 x > y ， 则 P (x)> 

p(n 

五、二叉树定价 

以无红利股票的买入期权的定价问题为例. 

股票现价20,三 月期， 敲定价尺= 21，无风险利率 r = 0.12, 
以二叉树表示股价，下面标明相应的期权价格.见图 4-7. 

这里是单期模型,期末股价可升至22,期权价格为 22-21 = 1, 
期末价格若降至18,期权作废，价格为0,要求0时刻期权价格 /. 
这时可构造如下组合:买进4份股票，卖出一份买入期权，选 d 使 
这个组合无风险. 

若股价上升，组合的价值为224 - 1. 
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若股价下降，组合的价值为 18 A 

为使组合无风险，必须有223 - 1 = 183,求得 d = 0.25,这 
时不论股价升降，组合的价值均为 4.5. 

其现值为 4.5 xe_° 12xA =4.367. 

从而组合的初始价值为20 x 0.25 - / = 4.367,故/ = 0.633. 
这个数值例子所用的方法可以一般化.见图 4-8. 



若在时刻 0 , 股票的价格为义一种关于它的衍生证券的价格 
为 /• 

在时刻 T ， 股票价格上升到或下降到 Sd ， 其中 d < 1 < 
这时衍生证券的损益分别 为九与 / d . 因为股票和它的衍生证券 
(例如买入期权）有同一风险来源，因此可以构成它们的一个证券 
组合，互相抵消风险而成一个无风险资产.按套利定价原则（或一 
价定律）这个组合的收益率应为无风险利率 r ， 所建立的组合称为 
套期保值组合.设有3份股票与卖出一份衍生证券，在: T 时刻，若 
股价上升，该组合的价值为 Sud - / u ; 若股价下降，该组合的价值 
为 SdA - f d . 为使组合无风险，应有 SuA - f u = Sd △- f d , 从而 
' _ fu - fd _ 衍生证券价格差 — 

Su — Sd " 股票的价格差 "AS 1 j 

称为套期保值比率.用此比率构成证券组合，不论股价升降，组合 
价值均为 SuA 一九或 SdA - U 

在0时刻，建立这个组合的费用是 SA-f = ( SuA - f u ) e ^ rT , 
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因此衍生证券的价格为 

f = SA- (SuA - f u ) e~ rT = e- rT [qf u + (1 - q)f d ) (2) 


其中 g = 


e r7 — d 
u — d 


fd 


在上例中 ， w = 1.1 ，d = 0.9, r = 0.12, T = 

丄 Z 

— d 

= 0, g = -— = 0.6523, 

u — a 

f = e "° l2X * [0.6523 x 1 - 0.3477 x 0] = 0.633 


fu = 


1， 


风险中立定价 Cox & Ross (1976) 指出在风险中立世界中， 
一切投资者对风险无所谓，从而有： （1) 一切资产都有同一收 益率; 
(2) 价格可由未来期望值以利率 r 贴现算出.二叉树中的人造概率 

q = ^zd 即为风险中立概率 

u — a 

这就提供了另一种定价思路， 

以上做法可推广到多期模型.这是 Cox - Ross - Rubinstein 在 
1979年提出的一个模型，既能说理也能用于数值计算,是期权定价 
中十分有名的模型，实质上是伯努利试验的乘法模型，其连续逼近 
为几何布朗运动. 


六、 It 6 微积分简介 

若有/⑷股证券,其每股价格为布朗运动则 [0, 中 

的收益为 f f(t)dw(t), 由于 W(t) 处处连续处处不可微，这种积 
Jo 

分在通常意义下无法定义， It 6 用均方收敛来定义. 

所谓随机微分 方程： 

dSt = a (5 t , t)dt + a(S t , t) dW t (3) 


意味着 


•t + T 

dS t = 


r 


a(St，t)dt + 


• t+r 
• t 


a{S u t)dW t 
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这种方程解的存在性与唯一性已证得，且为马尔可夫过程，通常称 

Ito 过程. 

ltd 微积分最基本的公式是 

dW t • dW t = dt (4) 


Ito 公 式：若 〜 df + ( T t dW t , 设 F ( S t , t ) 关于&二次可 
微,关于 t 一次可微，则 


dF t = 


dF 8 F ^ 1 d 2 F 

dS t dSt + ^di dt+ 2dS? (Tldt 



把 （3) 代入 （5) 得 


dF t 


dF dF 1 d 2 F 2 

+ + 7 ： - CTi 


L9t dSt 


2 as ? 


dF 

d f + - 一 


因此巧 的微分仍是 It 6 微分 ，巧 仍是 It 6 过程. 



七、 Black - Scholes 公式的推导 

基本 假定： 

无摩擦竞争市场，股票价格服从儿何布朗运动 


+ adW t 

有无风险债券,具常利率 r ， 即仙⑷= rB ( t ) dt ; 

证券在 [0, T ] 中连续交易，市场无套利机会，股票不派红利 • 
先用无套利方法,构造一个无风险组合: 4份股票多头和一份 
衍生证券空头，其价值为 7 T = AS - /，在 [ f，i ] 中假定3不 
变，用 It 6 公式， 

dir — AdS — df 


(% tlS+ % + l^ (72S2 ) dt 




aS dWt + A/iSdt + AaSdWt 
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为使 (1呢 的系数为0,必须而且只需取—这就是套 
期保值比率， 这时组合无风险，其利率必为 r , 故 

= mdt 




f) 


dt 


即得 Black — Scholes 方程 


% + rS % 




⑺ 


配合适当的边界条件,解此偏微分方程，可得 Black - Scholes 公式. 

另一种解法是利用 Cox - Ross 的风险中立定价方法，设股票 
的收益率为 r ， 并以 r 作为贴现率计算价格，这时计算公式为 

C t = e ^ T ^ E [ max ( S T — 厂， 0) ] (8) 


这里期望左对风险中立世界中的人造概率 g 进行计算. 

这正是我们在《概率论基础》习题四〃25题中的做法，具体 
计算过程见习题解答. 

这种做法由 Harrison - Kreps (1979) 和 Harrison-Pliska (1981) 
加以总结，发现了与鞅有密切关系. 

近代已 证明： 

资产定价基本定理 如下事实等价： 

⑴无 套利； （2) 存在正的线性价格 函数； （3) 存在等价鞅 测度; 
(4) 存在随机正折现 因子； （5) 最优证券选择问题有澥. 

九十年代的研究重点是利率期限结构，本世纪初则为信用衍 
生品. 
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教学札记之二十三 I 


事件的独立性与相关性 


一、 事件的独立性 

事件>1与事件 S 独立的定义为 

P ( AB ) = P { A ) P ( B ) (1) 

若事件 A ， B 独立，最直接的推论是 

P { A \ B ) = P ( A ) (2) 


P ( B \ A ) = P ( B ) (3) 


以后约定，当写条件概率 P ( A \ B ) Bt , 若未特别提出都假定 P ( B )> 

0 . 

事件 A B 独立的另一推论是 ( A , B ), ( A , B) y ( A , B ) 也独立 • 
从 （2) 出发，可以作进一步的讨论.例如，若成立 

P ( A \ B ) > P ( A ) (4) 


这时表明 B 的发生，使 A 发生的条件概率增大，因此可以说，刀的 
发生为4的发生带来“正信息”. 

事实上，若 P ( A \ B ) > 尸 ( A )， 则 

P { AB ) = P { B ) P { A \ B ) > P { A ) P { B ) (5) 


而且 


P ( B \ A ) = 


P ( AB ) 


P ( A ) P ( B ) 

P(A) 


= P(B) 


因此 B 有正信息是相互的. 
同理，若 


P { A \ B ) < P { A ) 


⑹ 


⑺ 


必有 


⑻ 


P ( B \ A ) < P ( B ) 


321 - 




称事件 A 与事件 S 互相带来“负信息”. 


进一步，若 P ( A \ B ) > P ( A )， 则 

鱗)= 醬 = 


P ( A )- P ( A ) P ( B ) 

pW) 


= P ( A ) 



因此若 B 给 4 带来“正信息”，则 B 必给4带来“负信息”. 


二、事件的相关性 

《概率论基础》第四章§2引人事件 A 与事件 B 的相关系数 

. P(AB) - P(A)P(B) ，〜 

Pab = / ■ 二 . _ ⑽ 

y/p(A)P(A)P(B)P(B) 

这是事件4的示性函数 U 与事件 B 的示性函数 1 S 的相关系数. 

当 P { A ) = 0或 P ( B ) = 0以及 = 1 或 P ( B ) = 1 时，补 
充定义二 0 . 

有了事件相关系数，就可以讨论事件的相关性. 

若定义事件 A 与事件 B 不相关为= 0,则 

〜= 0 ㈡ P ⑽）= P ( A ) P { B ) (11) 


因此事件 A 与事件 S 不相关的充要条件为事件4与事件 S 相互 
独立 • 

对于二值变量$与7/，它们的不相关性与独立性等价.这是与 
正态变量一齐分享的一个独特的性质，必然具有很高的研究价值. 
在正态场合，主要好处是线性预测即为最佳预测.关于这点在作者 
的另一本书中有较详细的讨论，见《概率论与数理统计》.复旦大 
学出版社， 2003. 

这里我们关心的是把相关分析推广到事件场合. 

当 〜 s > 0时称事件 A 与事件 J 5 正相关，当< 0时称事 
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件 乂 与事件 B 负相关,这时有如下 关系： 

f ) AB >0 ^ => p ( AB ) > p ( A ) p ( B ) ^ P {^\ B ) > P ( A ) (12) 

p AB=0 ^ p ^ ab ) = P ( A ) P ( B ) P { A \ B ) = P ( A ) (13) 


Pab < 0 ^ P ( AD ) < p ( A ) p ( B ) < P(A) (14) 


(12) 对应于正相关即“正信息”的 场合； （14) 对应于负相关即“负 
信息”的 场合； （13) 自然是独立即不相关的场合，这时 I 与5, A 
与瓦7与 S 也都不相关即独立. 


特别地 ，〜 s = 1，即完全正相关场合，对应于 A == 5;而 
P AB = -1 即完全负相关场合，对应于 A = B . 

回归方程是 


1b = P{B) + 


P(AB) - P(A)P(B) 
~~ ~P{A)P(A ) ~~ 


(U - P(A)) 


(15) 


1 a =尸 (力） + 


P{AB) - P(A)P(B) 
~~ P(B)P(B) 


(1b- P(B)) 


(16) 


教学札记之二十四塞 

母函数与分支过程 

一、分支过程的定义 

分支过程作为母体生长的一种概率模型最早由高尔顿-沃生 
进行研究，它是应用随机过程中比较重要的一个，是一种马尔可夫 
链，初始用于描述家族姓氏的延续，后来在核反应堆，植物母体生 
长等领域也有应用. 

由于它的本质是随机个独立同分布的整值随机变量之和，因此 
很适合于用母函数来研究. 

这个题材，本身相当重要，关于灭种概率的结论又十分深刻， 
还能显示母函数法的巨大威力，若非篇幅限制，是可以写入正文的. 

设每个质点能产生同类新质点，一个质点作为第0代，每个质 
点以概率外 （fc = 0,1,2, • • •） 产生 A : 个新质点，各代间与各质点间 
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互不影响，感兴趣的是第 n 代的质点数. 

若以 Xn 记第 n 代的质点数 . 义0 = 1，有给定概率分布 
{ pk , A : = 0,1，2, •” }，而 

= y[ n) + V 2 n) + ••• + !/=) ， n > 1 (1) 

其中对不同的 n 及不同的 i 都是相互独立、服从概率分布彳 pd 
的随机变量，即随机变量 X n 是 X n _! (也是随机变量）个相互独 
立相同分布整值随机变量之和.这样定义的随机过程 { X n , n ^ l } 
称 为分支过程. 

显然分支过程描述家族姓氏的延续，只计男丁，最关心家族是 
否能繁衍,从而要探讨断绝的可能性.在用来描述原子反应堆的中 
子数时，关心的是能否形成核裂变. 

这个模型显然很适合用《概率论基础》中母函数的方法来研 
究. 

记概率分布 { Pk } 的母函数为 P ⑷，即 

oo 

p ⑷ = ⑺ 

Ar=0 

若以尸 n ⑷记忍的母函数，则由该书 （4.4.14) 立刻得到 

尸 1(5) = P(s) 

P n+ 1 (S) = Pn{P{s)) = P(Pn(s)), n > 1 (3) 

二、灭种概率 

为使问题的讨论有意义，当然应假定0 < 如< 1. 记 A n = 
P{X n = 0} = P n (0)， 它表示第 n 代时质点数为0的概率，由定义 
知 A n 随 n 的增加而增加，因此必有极限，记为 A ， 称为该分支过程 

的灭种概率. 

关于灭种概率有下列定理及基本引理. 

定理 分支过程的灭种概率 A 满足方程 

A = P(A) 
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且是它的最小正根. 

证明 事实上，在0 < s < 1时， P ⑷是 S 的上升函数，而 
Ai =户⑼= p 。 > 0,故 

入2 =巧⑼= P ( Pi (0)) = P ( X x ) > P (0) = Ai 

于是用归纳法可证 

入 n+l = P ( An ) 〉 P ( An _ l ) = An 

因此序列 A n 单调上升地趋于一个极限 A ， 且0 < A 彡1，由于 P ( s ) 
是连续的，因此 A 满足方程 （4). 

如果 w > 0是方程⑷的任意一个根，则 Ai = P (0) < P { u ) = 
u ， 因此用归纳法得知 

入 n+l = P (入 n ) < P { u ) = U 

这说明 A < tx , 因此 A n 趋于方程 A = P ( X ) 的最小正根. 

基本 引理设 m = ^2 ^ Vk 是后代期望数.如果 m < 1，则过 

k =0 

程将在第 n 代之前灭种的概率趋于1;如果 m > 1，则方程 A = 
P ( A ) 存在唯一的根 A < 1，且 A 是过程在有限多代后灭种概率的 
极限. 

证明 由于 f^Pk = 1,故由魏尔斯特拉斯判别法知 P ( A ) 

k =0 

在 [0,1] 中一致收敛 • 显然对0 < A 彡1， F r ( A ) > 0, P ,, ( A ) ^ 
0,所以 P ( A ) 是单调上升的下凸函数.由假定 P (0) = po > 0, 

oo 

P ( l ) = ^2 pk = 1，故 P {\) 的图形只能如图 4-9 的⑷， （ b ), (c) 表 

k =0 

示的那样，它与对角线至多交于两点.其中 

oo 

m = ^2 kp k = P \ l ) 

k =0 

当 m < 1时， P ( s ) 在 （ 1，1 ) 的斜率不大于1，于是方程⑷只 
存在一根 A = 1;而当 m > 1时， P ( s ) 在 （ 1，1 ) 的斜率大于1，于 


- 325 - 




图 4-9 

是方程⑷有一根0 <《< 1， 此时 A = ^是灭种概率. 

基本引理说明，不但“一代不如一代”即 m < 1的家族必定灭 
种,就是临界状态 m = 1俗称“单子独孙”的家族也必定灭种.这 
在随机现象中是普适的，因此这个结果常在概率论的各个分支中 
被引用，故称基本引理. 
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第五章极限定理 


1_」 

本章的结构依全书模块式结构的设计安排，分为三个层次，逐 
步深人 

首先，第一节讲概率论极限定理的策源地——伯努利试验，所 
用方法比较初等，它的结论与应用也比较直观，并且和频率与概率 

的主题密切 相关. 作为其应用，第一、二章的一些计算问题在这里 
得到完满的解答. 

其次，第三节讲独立同分布场合，特别适用于统 计学. 第二节 

则为其作概念和工具上的准备，特别是证明了分布函数与特征函 

数对应的连 续性， 为特征函数成为研究概率极限定理的主 力工具 
奠下基石. 

最后，第四节讲强大数定律，第五节 讲一般 中心极限定理，都 
是很深刻的结果，证明的技巧性也很强. 5 

，课文导谏 


§5.1 伯努利试验场合的极限定理 

在引进以随机变量与分布函数为代表的近代表述方法以及数 
字特征与特征函数等概念和工具之后，又回到伯努利试验、这是早 
期概率论发展最丰饶的一块 园地. 迄今为止，概率论最重要的理论 


r ■鲁，- -■ - I . ^^ , 

暈前引 
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成果，其源头几乎都可上溯至此；即使在现代，新的成果也常要拿 
到这里来做初步的验证. 

奠定概率论学科基石的两大理论成果 -- -大数定律与中心极 
限定理于18世纪初在这个园地相继诞生.本节将以现代概率语言 
评述这两大经典结果. 

由雅科布•伯努利明确表述并加以严格证明的第一个大数定 
律是概率论这一学科的灵魂和象征，一百多年后被泊松推广并命 
名，后被以切比雪夫为代表的俄罗斯学派发展成为很精细的 理论. 

对大数定律，《概率论基础》直接用“矩法”得出普遍结果，再 
把上述两大经典定律作为特例，最后论述了它的重要理论意义和 
实际应用价值. 

1733年棣莫弗找到 p =\ 时二项分布一般项的一个渐近表达 

式（参看习题五10题），概率论的标志——正态曲线正式登场，半 
个多世纪后被拉普拉斯发展成为一个漂亮的极限定理，之后关于它 
的研究占据概率论舞台近两百年，最后获得中心极限定理的美名. 

对中心极限定理，《概率论基础》在本节沿着棣莫弗的思路用 
斯特林公式作逼近，导岀局部极限定理，然后用积分定义给出积分 
极限定理,既采用当代表述形式，又尽量保持历史发展的原生态. 

最后是中心极限定理的应用，该段包括重要内容： 

(1) 导出大数定律.说明中心极限定理比大数定律更强.粗略 
讲，大数定律表明 / i n _叩是 。 ㈤ ， 只指出它是几的低阶无穷大， 
而中心极限定理则进一步指出是 0( x /^)， 表明了 ii n - np 是与 W 
相同阶的无穷大. 

(2) 提出用频率估计概率时的三类计算问题，并给出实例.实 
际上，以后一般中心极限定理应用中遇到的也是同样的这三类问 
题，不再细讲. 

值得注意的 还有： 置信区间估计这类统计方法在此以频率估 
计概率的例子形式首次出现. 
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(3) 完满解决了第二章提出的大量计算问题 • 

总之，这是理论与应用并重的一节，频率与概率的关系到这里 
基本讲清.至此，《概率论基础》的“基础教程”目标实现. 

§5.2 收敛性 

上节使用矩法和直接展幵证明了伯努利试验场合的大数定律 
与中心极限定理.当推广到一般独立和这一更加复杂的场合，这些 
方法常常施展不开，必须另找新的工具.经百年努力，终于找到适 
合的工具特征函数.在上章已引人特征函数，讨论了它的性质，并 
在研究多元正态分布中初显威力.本章将用它来研究极限定理.历 
史上它就是为此而引进的，也因为它的使用而获得许多成果，但是 
人们也发现，为使整个证明过程严格，有些基础必须夯实，这些努 
力最后导致连续性定理的提出与证明，它们归功于莱维与克拉美. 

连续性定理证实了用特征函数列收敛来证明分布函数列收敛 
的合理性,建立了这两种收敛的对应性.为此必须搞清什么是分布 
函数列收敛，研究表明适当的定义是弱收敛性，而特征函数列则是 
内闭均敛，连续性定理断言了这两种收敛的等价性. 

第一小节引人分布函数列的弱收敛性，并证明了海莱的几条 
定理，它们在实函数论中有独立的兴趣，但在这里被引用则是为下 
一小节证明正、逆极限定理（合称连续性定理）作准备.依传统这 
些定理的证明细节全被写出，因此本小节分析论证的分量很重，任 
课教师可据具体情况取舍. 

第二小节证明了正、逆极限定理,其中逆极限定理的证明也是 
相当繁复的.重要的是要明白正、逆极限定理的含意与用途. 

第三小节定义了随机变量的四种收敛性并讨论了它们之间的 
关系，这是将来研究各类概率极限定理的基础知识，当然十分基本 
而重要.应当说明，对于以概率1收敛，主要讨论放在第4节进行， 
这里只出现定义. 

这些收敛性的关系如图 5-1 所示： 
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rfl 阶收敛 


图 5-1 

到此为止，已为极限定理的讨论做好一切准备. 

第四小节给出了刻画特征函数充要条件的波赫 纳尔辛 钦定 
理，表明非负定性是特征函数的关键性质. 

第五小节顺便讨论了某种意义下帕斯卡分布向埃尔朗分布的 
收敛性，同理负二项分布将收敛于 r 分布. 

§5.3 独立同分布场合的极限定理 

本节把大数定律和中心极限定理推广到独立同分布的场合，特 
征函数显示了它的强大威力. 

独立同分布可以说是概率论的第三个重要模型，另外两个是 
古典概型与伯努利概型,而且伯努利概型是它的简单特例. 

当代统计学也把理论框架建立在独立同分布的基础上，即认 
为样本是总体的独立同分布观察即简单随机样本，这更增加了该 
模型的重要性.因而本节的结果是数理统计中最常引用的. 

本节证得的两个结果，在大数定律中辛钦大数定律，要求只是 
数学期望存在，这是十分自 然的； 在中心极限定理中林德伯格-莱 
维中心极限定理,成立的条件是0 < a 2 < oo .若 a 2 = 0,则随机变 
量序列是常数序列，无须讨论极限定理 .若/ = oo , 则无法规格 
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化，中心极限定理也无从谈起.因此这两个定理几乎没有条件，是 
最终结果.另一方面，这两个定理（不要忘记伯努利大数定理与棣 
莫弗-拉普拉斯积分极限定理是其特例）在概率论中大约是引用频 
率最高的理论结果. 

本节的另一看点是特征函数在处理独立和极限定理中的简单 
明了与巨大威力.对照之下，两个定理的证明过程极其相似，而这 
也是用特征函数证明概率极限定理的通用程序，值得读者再三玩 
味，并通过若干习题演练，掌握诀要，以期将来在复杂场合能举一 
反三 • 

辛钦定理也可以用改良的矩法（对随机变量“截尾”使之有 
界）来证明，但还是用特征函数法明快. 

本来特征函数对应于分布函数只能用来处理依分布收敛，但 
当收敛于常数时又等价于依概率收敛（这就是定理 5.2.7 的重要 
论断），因此也能用于处理大数定律.这就大大增加了特征函数在 
处理概率极限定理中的重要性.这点也是值得读者注意的. 

《概率论基础》第三版中重点强调了这两个定理在数理统计 
学中的应用，结合当代数理统计的理论框架，读者将会有许多思考. 
关于在蒙特卡罗法中的应用也如此.参看教学札记之二十五“统计 
学和概率论”. 

多元中心极限定理引用极多，但很少看到有教科书写出证明 
的.《概率论基础》前有特征函数与多元正态的大量积累，现有林 
德伯格-莱维中心极限定理，顺理成章地写出了严密的证明. 

根据模块式结构，《概率论基础》到本节为止，构成“基本教 
程”，能满足一般学科对概率论的要求. 

§5.4 强大数定律 

本节讨论以概率1收敛及强大数定律.博雷尔在正规数研究 
中证明了一条定理，现在称之为博雷尔强大数定律，提出了以概率 
1收敛性，为后来的研究开辟了新道路. 
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前两个小节的内容可列入基本要求，其中博雷尔_康特立引理 
是理论研究中经常用到的，对理解以概率1收敛的涵义和证明强 
大数定律是基本的.博雷尔大数定律针对伯努利试验场合，是伯努 
利大数定律的加强，而且这条定理的证明方法也相当初等，只要用 
到马尔可夫不等式及上述引理，相信大部分读者都能读懂. 

到了独立同分布场合，只要4阶中心矩存在，则成立强大数定 
律（见习题五46题），证法与博雷尔强大数定律大体平行.后来 
科尔莫戈罗夫得到最好的结果，这是第四小节的主题. 

第一小节证明了以概率1收敛可推出依概率收敛，因此成立 
强大数定律必成立（弱）大数定律.下面是成立弱大数定律而不成 
立强大数定律的一个例子： 

若 X U X 2 ，… 、 X n 、… 独立同分布，且 

P{Xi = n } = P{Xi = 一 n } = n = 3,4,5, . • . 


其中 c 是常数，等于 


这时五 | Xi | = GO, 故科尔莫戈罗夫强大数定律不成立，辛钦大 
数定律不能用，但能成立《概率论基础》 (5.1.9), 即对 { X n , n = 
1，2, • • •} 成立弱大数定律而不成立强大数定律. 

第三小节是本节的要点与难点. 


证明强大数定律主要使用两件工具，一是博 雷尔康 特立引理, 
二是矩法的不等式.马尔可夫不等式正如上述只能用于证明存在4 
阶矩的场合成立强大数定律，对更一般场合必须强化这些不等式， 
这个工作为科尔莫戈罗夫所完成，他证得的科尔莫戈罗夫不等式 
是该领域的主要武器.《概率论基础》采用推广它为噶依克_瑞 
尼不等式的方式证明了一般场合的科尔莫戈罗夫强大数定律. 

关于强大数定律的证明方法的进一步讨论见教学札记之二十 
九“强大数定律证明途径评述” 

本节是测度论概率论的重要组成部分，但.本书还是严格坚持 
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其微积分基础假定. 

§ 5.5 中心极限定理 

长达200年历史的中心极限定理在20世纪有了突破性的进 
展.首先是世纪初李雅普诺夫利用特征函数法证得了很一般的定理 
(《概率论基础》定理 5.5.4) ，后来在20年代林德伯格找到很一般 
的充分条件林德伯格条件，最后在30年代费勒证明在某种条 
件（后称费勒条件）下，林德伯格条件也是必要的.这样一来，中 
心极限定理最终获得解决.本节介绍这些结果. 

第一小节仔细地研究了林德伯格条件与费勒条件. 

第二小节给出林德伯格-费勒定理的详细证明，使用的工具是 
特征函数.这个证明充分体现了特征函数法的精妙.该证明过程的 
主体取材于费勒晚年的名著，《概率论基础》略加编排.学习本节 
的要点之一是体会特征函数的精密使用. 

第三小节作为上述定理的推论给出李雅普诺夫条件即《概率 
论基础》 （5.5.34) 和另一个充分条件，它们通常比林德伯格条件更 
便于验证. 

本节的特征是分析性的，即本节内容是分析概率论的重要组 
成部分,可以避开测度论. 

习题五的最后十道题目，是本节的有机组成部分. 

至此，《概率论基础》的“高级教程”全部讲完. 


L 习题解答与评注 

1.( 为非负随机变量，若 Ee # < oo , (a > 0), 则对任意 x > 0, 

^ x} ^e~ ax Ee a ^ 
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证 记 C 的分布函数为 F (: r )， 对任意 x >0， 

尸 U ^ x }= J dF ( y ) 

/ e ay d ，） 

y>x 

^ e- ax f °° e ay dF { y ) 

Jo 

= e~ ax Ee a( 

【评注】又一种切比雪夫型不 等式. 

2 •若> 0, C 为随机变量，且 Eh {0 < 00 ,则关于任何 

C>0, 

P{h(0 C^Eh(0 

证 记 WO 的分布函数为凡⑷，对任意 C 〉0, 有 

P{h(0>C}= J dF^x) 


x^C 


I 

xdF h ( x ) 

x^C 


^ir 

CJo 

xdF h ( x ) 


= b Eh o 


【评注】还是一种切比雪夫型不等式，实质是马尔可夫不等式. 

* 3 . (单边切比雪夫不等式）设《为随机变量，= 0 , 
= a 2 < oo , 则对任何一^个 a 〉 0 ,试证 
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证 


记€的分布函数为 F ( x ), 因为五《= 0,所以 




(a ― x) dF(x) ^ 



(a — x) djF(x) 


*oo 

! (a — x)J a (x) dF(x) 


其中 Ja(x) = ( a < a ，由于 a > 0 ,两边平方得 
l 0, x ^ a 


(a — x)J a (x)dF(x) 


柯西-施瓦兹不等式 

< J 

J — oo 


(a — x) 2 dF(x) - f Ja( x ) dF(x) 

J — oo 




(a — x) 2 dF(x) - F(a) 
(a 2 + a 2 ) F(a) 


-oo 


所以 


F(a)> 


a 


a 2 + a 2 


或等价地 


P{^ a} = 1 - F(a) ^ 1 


a 4 


a 4 


a 2 + a 2 a 2 + a 2 


【评注】不再是一般推广而是有新意. 

4. 设 n > 1} 是独立随机变量序列，对所有 n ^ 1, Z>^ n 
存在且 0, 试证 ：^， n > 1 丨服从大数定律 . 


证由极限理论知，对数列 {a n }, 若 a n — a, 可推得其前 n 


项的算术平均构成的数列 


n 




afc 


a. 
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本题 已知^ °， 则得 


因而 



n — oc 


k=l k=l fc=l 

所以马尔可夫条件成立，于是 {《 n ， n ^ l } 服从大数定律. 

【评注】这是很便于验证的一个充分条件，完全可以写入教科 

书中. 

5.若6：的分布列为 



\/In k —\/ln k 


1 1 

2 2 


试证大数定律适用于独立随机变量序列 
证 路 = 0 




In 厂 ） + - ^ — \/ln fc) =\nk 


^( E ^) = ^ E lnA:< ^ nlnn 

fc=l k=l 


In 


n 


0, n —> oo 


满足马尔可夫条件，故大数定律成立. 

【评注】一道简单练习题.马尔可夫条件是大数定律成立最普 
遍的一个充分条件，所以首先试它.当然证得习题4的结果后，也 
可用它验证. 

6. 验证概率分布如下给定的独立随机变量序列是否满足马尔 
可夫条件： 

(!) P{^k = 士 2 ” = 
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(2) P { X k = 土 2 fc } = 2~( 2fc+1 ), P { X k = 0} = 1 — 2- 2fc ; 

(3) = 土 / c } = P { X k = 0} = 1 — fc 去 • 

提示： 几种基本类型，如上题一样，直接代入《概率论基础》 
(5.1.13) 验证. 

答 （1) 不 满足； （ 2 ) 满足； （3) 不 满足. 

【评注】几道典型题.还将用于本章习题 47. 

7•若匕 具有有限方差，服从同一分布，但各 fc 间，6：和 心 +1 
有相关，而心 ，^ {\ k - l \^ 2) 是独立的,证明这时对{心}大数定 
律成立. 

证由于 | A : - Z 丨彡2时,^与&独立，所以 

k=l k=l 

1 71 71—1 

= P t H + 2 H COV (“ ，“ + 1 \ 

fc=l / c=l 


1 2 n — 1 
fc=i 


^6 


r\c 9 

^ —— H —— D^i —— ► 0 (n —► oo ) 
n n 


马尔可夫条件成立,所以对序列 {&} 大数定律成立. 

【评注】允许相邻变量相关，仍能成立大数定律. 

8. (伯恩斯坦定理）已知随机变量序列^，匕,…的方差有界: 
并且当 K - )1 — OC 时，相关系数％ — 0,证明对 {6} 
成立大数定律. 


证因为 \ i - j \ — 6 o 时 ， ro — 0,所以对任给6： > 0,存在 iV , 
使当 \ i - j \> N 时有 |~| < #，于是 



n 


2 


k^l 


r ij a i (J j 
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c 

=—+ 
n 


2_ 

n 2 


: \ r ij Wi^j 


2^ 

n 2 


> : \ r ij Wi^j 
j-i>N 




c 

—+ 
n 


n^ NC + 




n n \ n / 


^- + ^^+6 
n n 


(第二项 E \^ ij \(^ i(Jj ^ ^ : C ， 对母个固定的 i ， 因 

0 < j - j^N 0 < j - i^N 

i < j , j - i ^ N , 所以最多对应 iV 项，而 i 可依次取1，2，." ， n ， 
因而和式最多有 nTV 项.第三项中，因 i < j < n ， 所以对 i 分别取 

#另^最多对 l 5 n —}••• 5 1 项,从而 i 亥和式 

最多含 （n — 1) + (n - 2) + …+ 1 = + 9 - — ” 项 .） 

固定#后，前两项在 n — oo 时趋于0,最后一项可任意小, 
故马尔可夫条件成立，从而对 {&} 成立大数定律. 

【评注】伯恩斯坦 （1880 —1968)， 苏联概率统计学家，对概率 
统计贡献甚多. 

若方差有界，只要不是前后变量一直保持相关，大数定律仍能 
成立.本题显然把上题结论大大往前推广. 

从上两题可看出，马尔可夫条件也能用于处理非独立序列的大 
数定律，这是一大推进. 

"9. (格涅坚科定理）对随机变量序列忆}，若记％ = -(^1 + 

n 

…+ ^)，知=+ • • • +说 n )， 则忆}服从大数定律的充要条 
件是 


- < 咎， ) 2 } = 

n—oo t 1 + (77 n - a n ) 2 J 


0 


• 338 - 



证充分性：是: T 的增函数，因此对£>0,有 

^ilVn ~ tt n | ^ s} = J di^ n (y) 

\y-an\^£ 




1 


l +€ 2 



| y - an|^e 


(y — dn ) 2 

1 + (y — a n) 2 


d ^ n (2/) 






= 1 + g 2 

£ 2 \ 1 + (r?n - a n ) 2 J 

因而当 gjj H ; } — 0 时，有 P {\ Vn - a n \ > e } — 0,于 

是 {&} 服从大数定律 • 

必 要性： 由于 

n ^ pj (Vn — CL n ) 2 \ 

0 ^nr+T^r-a^/ 



\y~a n \<e 


(y-a n ) 2 
1 + ( y - a n ) 2 


dF Vn (y) + j 

\y-a n \^e 


(y - CLn ) 2 
1 + (y-a n ) 2 


dF Vn (y) 


< T ^P{\Vn-a n \<s} + l.P{\r 1 n -a n \^e} 


<e 2 + P{\rin - a n \ > e} 


若服从大数定律，由 e 的任意性，可得 





0 


【评注】有名的结果，漂亮的证明. 

顺便指出，从证明中可以看出，格涅坚科条件事实上是 r/ n — 
a n 的充要条件，不只用于大数定律， 

10. 用斯特林公式证明：当 n — oo，m — oc，n — m — oo ， 而 
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m 


n 


0 时， 

2n 

v n — m / V 2 / y/rva 

证由斯特林公式 

(2 n )! 


e 


■in 1 /n 


( 2n Vlf = 

\n — my \2 / 


(n — m)\{n + m )\ 




2n 


\/2 jr 2 n (2 n ) 2 n e- 2n - 


- m ) n - m e -( n - m ) 

1 ,1 、 2n 

y /2 ji ( n ^\- m)(n + m ) n + m e —( n+m ) ^2 / 


2 n 


(- 


n \ n ^ m f n \ n + m 
— m ) \n + m ) 


y /2 n \ n 2 — m 2 V n — m 


n + m . 


e ： 


士 O ) 2 


(1 一 ( n — 、一 ( n+m ) 0 


n ) 


其中閘 < 7^( KT + 


1 


hi )- 


12 \2 n n — m n + m 
由 ln(l + x ) = x —~ + — ~ -得 

Zi tj 


In 


m 


n 4 


2 


r (- 


0 2 +(m - n) 


m \ m_n i 
n ) 1 
r m 

n 


m ’ 

H - 

n - 


一 （ n+T7i) 




2\ n ) 3 \nJ 


一 （n + rri ) 

.2 


m 

n 




\ 2 1 / m \ 

) + 3 ( 7 ^) 


3 


+ e + 


m 


而 


m 


4 


n 

m 2 m 2 


2 m 4 1 m 2 

— _ -4* —n* f/ -t~ ••- 

3 n 3 2 n 2 


假定 ^ 是一有界量，则 = 故有 

n \ n / 

)ar 〜上一 ^ 


rr 


n n 


2 


2 n 
n — m 


yfzm 


【评注】这是 1733 年棣莫弗论文的现代表述，以正态曲线逼 
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近 p = i 时的二项分布，正是这一工作使棣莫弗的名字永栽概率 
史册. 

11 •用 （ 5.1.27) 计算 b(5; 500, 0.01) 及 6(40; 10 000, 0.005) 并 
与精确值比较. 

提示：取前两项. 

答 (1) 6(5; 500, 0.01), (5.1.27) 计算为 0.179 31, 精确值为 

0.176 35. 

(2) 6(40; 10 000,0.00 5 )， 用 （ 5 丄 27 ) 计算为 0.021 4, 精确值为 
0.021 4. 

【评 注】 比起用 （ 5 丄 38) 计算，一般能得出更精确的结果. 

现代用一只小型科学计算器几秒钟就能算出二项分布的精确 
值，但正是当年计算的困难才推动人类发现正态分布律！ 

12. 某计算机系统有 120 个终端,每个终端有 5% 时间在使用， 
若各个终端使用与否是相互独立的，试求有10个或更多终端在使 
用的概率. 

提示： 用修正公式，见《概率论基础》 (5.1.41). 

答 0.072. 

【评注 I 代表一类非常实用的实际问题. 

*13. 求证，在 x > 0 时，有不等式 

x r°° - 妥」 1 - f 

TT^ e e dt S e 


证当 : T > 0,有 






— e 


-4 



另一方面 






t 4 + 2t 2 -l 
t 4 + 2t^ + 1 


-妥 


€ 


dt 
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I d ( _ r+p 

x 


e 




1 + t 2 


e 




X 


— 1 + x 2 

【评注】很有用的不 等式. 当 a ; 比较大，在正态分布数值表上 
找不到时就要用这个不等式估算. 

14. 用棣莫弗-拉普拉斯定理证明，在伯努利试验中，若 0 < 
p < 1，则不管 K 是如何大的常数,总有 

P{|/i n - np\ < K} — 0 (n —► oo) 

证 对任意固定 K ， 对任意5 > 0,存在爪，有 


•yi^ipq 


e '^ dx <? 


y/N^pq 

又由棣莫弗-拉普拉斯积分定理，有 


P< 


I/in -np | 〈 K 1 
V^ipqj 


y/rm 

所以存在 AT 2 , 当 n > TV ? 时，有 


命 e"^dx 


y/N^pq 


P< 


l^n - np\ 


< 


7 ^} 


< 


s/N\pq 


\rm 

取 TV = max (iVi ， 爪)，当 n > TV 时， 


c 




y/Nipq 


dx + - < S 


P{lf , n - npl< KUP{ l ^< 7 ^}<S 


从而有 


P{\^n — ^p| < K} —► 0 (n — 00) 

【评注】青山遮不住，毕竟东流去.偏差 |/ in - np | 的“阶数” 

是 y/^PQ- 

15. 用切比雪夫不等式确定当掷一均匀铜币时，需投多少次才 
能保证使得正面出现的概率在 0.4 至 0.6 之间的概率不小于90%， 
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并用正态逼近计算同一问题. 

提示： 前者直接用切比雪夫不等式计算，这是该不等式的用途 
之一，值得一做.后者用《概率论基础》（5.1.30)，属频率估计概率 
中第二类问题. 

答用切比雪夫不等式， n > 250次； 

用正态逼近 ， n > 68次. 

【评注】二者差距太大，你是如何想的？ 

16. 用切比雪夫不等式及棣莫弗-拉普拉斯极限定理估计下面 
概率： 

p {\^^ p \ >£ ] 

并进行比较，这里 / in 是 n 次伯努利试验中成功总次数， p 为每次 
成功的概率. 

解用切比雪夫不等式， 

L n ) e z n z ne z 

用极限定理， 

和卜 p { 

2 


V yt Ey/n 



所以当 n 较大时，极限定理能得到更精确的估计. 

【评注】切比雪夫不等式只要知道均值与方差，不管分布如何， 
都可对概率作估算，应用范围很广，但有一利必有一弊，它的估计 
就不可能很 准确. 极限定理涉及精确分布，只要 n 大到它成立，得 


iMn - np \ 〉 eynl 

〆 y/pq) 
=r e'^dt 



出的结论就较准确. 

17. 现有一大批种子，其中良种占 1/6, 今在其中任选 6 000 粒， 
试问在这些种子中良种所占的比例与1/6之差小于1%的概率是 
多少？ 


提示： 积分极限定理的直接应用《概率论基础》 （5.1.29). 

答 0.96. 

【评注】用积分极限定理计算频率估计概率的第一类问 题：已 
知 n , p , 6：求概率 

18. 种子中良种占 1/6, 我们有 99% 的把捤断定在 6 000 粒种 
子中良种所占的比例与1/6之差是多少？这时相应的良种粒数落 
在哪个范围内. 


提示：用 《概率论基础》 (5.1.31). 


答差是 0.012 4. 良种粒数落在 925 粒与 1 075 粒之间. 

【评注】同上，属第三类问题，求 l 

19. 若飞机乘客购票后按期搭机的概率为 p , 各乘客的行动假 
定是独立的，试问一架200座飞机售出202张机票不发生超座的 
概率. 对 p = 0.97, 0.96, 0.95, 计算上述概率. 

解记/ X 为购票后按期搭机的旅客数，则 


200} = P 



fi 一 20 2p 
^202^(1 - p ) ^ 


200 —202 p \ 

v /202 p(l - p )) 


200 + 0.5- 202 p 、 

v/202p(l ,pT / 


P 

0.97 

0.96 

0.95 

P 

0.970 

0.991 

0.997 


【评注】从另一个角度讨论超售 问题： 固定超售数额，对不同 
假定的 p 值计算不出现拒登机的概率. 

*20. 设分布函数列 { F n ( x )} 弱收敛于连续的分布函数 F ( x )， 试 
证这收敛对 xeK 1 是一致的. 
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证对实数 M < 7 V ， 有 

SUP | F n ( x ) - F ( x )| ^ / n? l + J n,2 + In y 3 + In ,4 + / n ,5 (*) 

xen 1 

其中 

/ n，l = sup Fji [ x ) = F n ( Af ) 

— oo < x^M 

/ n,2 == sup F ( x ) = F ( M ) 

— oo < ac^M 

J n ，3 = sup | F n ( x ) - F ( x )| 

J n ，4 = sup [1 — F ( x)l = 1 一 F ( N ) 

N<x<oo 

J n ，5 = sup [l - F n ( x )] = 1 - F n ( N ) 

N<x<oo 

对任给 e > 0,取 Af 和 AT 分别使 J n ， 2 < e 和 / n ， 4 < e . 由于 
F n 」％ F 且 F 在 R 1 上连续，故又有 lim i lim J n ， 5 < e 

n_^oo n—♦oo 

和 lim J n ， 3 = 0. 于是在 （*) 中先令 n — oo , 再令 e — 0 即得所要 

n—oo 

结论. 

【评注】这是很重要的一个结论，省去极限定理讨论中的许多 

麻烦. 

•设 ( F n ( x )} 为一列正态分布函数，收敛于分布函数 F ( x ), 
试证 F ( x ) 也是正态分布函数. 

证设 F n ( x ), F ( x ) 的特征函数分别为 / n ⑷和/⑷，由题意 
lim / n ⑷= lim = f ( t ) 

n—*oo n—*oo 

因而有 

|/ n (<)|= e -^ t 2 —^|/( t )| 

因特征函数 / ⑷的连续性且/(0) = 1，故存在 to _ 0使 f ( to ) ^ 0, 
故而 

— >lo S |/(^ o )| 7^ -CJO 
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于是得 lim d 存在，记该极限为 a 2 . 

n—oo 

这样就有 

—> f{t)e ^ 2t2 

且有 

|/(f)e^ 2t2 | =^^|# 叫 =1 

故同样可得 lim / x n 存在，记 lim / i n = ^，于是 

n—»oo n—»oo 

= f n ( t ) —. f ( t )= 

所以 F { x ) 也是正态分布. 

【评注】正态分布的重要性质之一.证明过程再次显示特征函 
数的 威力. 不禁要问，如果没有特征函数，要怎样证明这个结果？！ 
•22. 试证若正态随机变量序列依概率收敛，则其数学期望与方 
差也收敛. 

证若以 F n (: r ) 及 F ( x ) 分别记正态变量 X n RX 的分布函 

数，由忍二 X 可推得 X n JU X ,从而 F n ( x ) ^ F ( x ), 由本章 
习题21则可得结论. 

【评注】也是一个很有用的性质. 

*23 .若 Xn 为多维正态随机向量,^ X ，试证 X 为正态 
向量. 

证首先注意教科书上的一个定理：$ = ，6) t 服从 

k 元正态分布 N ( a ， S ) 的充要条件是它的任何一个线性组合 （ = 

k k k 

服从一元正态分布 

j=i j=i t ， j=i 

设 = ( Xw ，…， x nik ) T , X = ( A ，…，為) T ，由 上 

A ? 

x, 得任一线性组合 K 上 y = YlijXj , 因此有 

i=i j=i 

r n r, Fy n ( x ) F y ( x ), 由前述定理知服从一元正态分 
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布，再由本章习题 21 知 y 也服从一元正态分布,再由前述定理得 
X 为多元正态向量. 

【评注】把多维正态的证明问题化为一维问题，切记!本章习题 
*26 也立一功. 

24.若的概率分布为 



0 n 


i-I i 

n n 


试证相应的分布函数列收敛，但矩不收敛. 

证 f 0 ,当 

F n ( x ) = P { X n < x} = < 1 — ^ , 当 0<o: 彡 n 

\ 1 ，当 a ; > n 

令 n — oo , 得 


F n ( x ) 


F { x )= 




x > 0 


这表明分布函数列收敛. 

但 = 1 ， 五 ； ^+0 {n oo). 

当 fc > 1 时， 

EX!l = nd n k ~ l 
n 

E(X n - EX n ) k = E(X n ^ l) k = ( 一 1 产 (1 - + (n — 1 产 • i 

\ n/ n 

所以当 n — oo 时， EXji — oo, E(X n - EX n ) k — oo, 由此知 
的原点矩、中心矩均不收敛. 

【评注 I 很容易想出的一个反例，第五章 §2 例 4 亦可参照. 
*25. (斯卢茨基）随机变量序列{^}具有分布函数列 ( F n ( a :)}, 
且 F n ( x ) ^ F (: r )， 又 { Vn } 依概率收敛于常数 C > 0,试证： （1) Cn = 
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Cn + T ? n 的分布函数收敛于 F(x-C )； (2) Cn -— 的分布函数收敛 

Vn 

于 F(Cx). 

证 （1) 对任意5>0, 一方面 

^{Cn + Vn <X} 

= P{^n-\-Vn<X, \T] n -C\<£} + P{^n+Vn < \Vn-C\^e} 

(P{^n +r)n <X, \T} n -C\ <e} + p{\r) n -C\^e} 

彡 P{^n < x — {C — e)} + P{|^n — C| ^ £■} 

而 P{\7) n 一 C| 彡 e} ― ► 0 (n — oo), 所以有 

lim F“(x) 彡 lim F n (x - C + e) 

n—^oo n—^oo 

另一方面 

P{U<x-(C + e)} 

=P{^n <X-(C + e), \r)n -C\ <e} 

+ 尸 {Cn < x — (C + s)^ \r) n — C\ ^ e} 

彡 p {^n <x-(C + e), \r]n -C\<e} + P{q n -C\^e} 

< P{^n + Vn < x} + P{\T) n 一 C| 彡 e} 

还是因为 P{\vn 一 C| 彡 4 — 0 (n — oo )， 所以又有 

lim F n (x — C 一 e 、（ lim F^ n (x) 

n—^oo n—►oo 

由于分布函数至多有可列个不连续点，因此可取: T- C 及: T- 
C±e 为 F(x) 的连续点，且将上两式合并考虑之，则得 

lim F n (x — C — e) ^ lim F^ n (x) ^ lim F^ n (x) ^ lim F n (x — C + e) 

n — >oo n—»oo n—oo n — ^oo 

再由 F n (x) — > F(x) 可知 

F(x 一 C 一 e ) 彡 Um F ( ^ ri (x) < lim F^ n (x) ^ F(x — C + e) 

打 ^OO 
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最后令 s — ► 0, 即得 


lim 化⑻ = F (尤一 C) 

n — 

(2) 对任给 0< e < C , 

p {'t <x } 


\Vn — C\ < e| + \r] n — C\ ^ s 


Vn 


\^~C\<e} + P{\r ln -C\^e} 


^ P{^n <(C + e ) x } + P{\Vn - C \^ e } 

故有 

lim F ^ n ( x ) ^ lim F n ((C + e ) x ) 

n-*oo n—►oo 、 7 

另一方面， 

P{^n < (c - e ) x } 

= P {^ n <( C - e ) x , \ f ) n - C \< e }+ P {^ n <( c - e ) x 1 \ vn - C \^ e ) 

彡 ^{Cn < (C — e ) x , \ r] n — Cj < e } + F {|77 n — C | ^ e } 

^ p |— < a ;| + P {\ T] n — C \ ^ e } 

得 

lim F n ((C - e ) x ) < lim F Cn { x ) 

n — n — ►oo 

可取 CxR ( C ± e ) x^J F ( x ) 的连续点，于是， 

F{{C - e ) x ) < lim F ^ x ) ^ lim F in ( x ) < F (((7 + e ) x ) 

n—►oo 71-^00 

令 e — 0 得 

lim F ^( x ) = F { Cx ) 

n—oo 

【评注】本题与以下两道习题分别涉及随机变量收敛性的三类 
问题，结论常用，证法典型， 
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苏联数学家斯卢茨基在1925年 证得： 若一个序列依分布收敛， 
一个序列依概率收敛，则其和、差、积、商必依分布 收敛. 这里举 
其要为题. 

接下来很自然会 提问： 若两个序列都是依分布收敛，其和是否 
依分布收敛？这个结论在何种条件下成立？ 

*26. 试证： 

( I ) X n ^X ^ X n -X -^0] 

⑺ X n ^ X y X n ^Y p{x = y } = l ； 

(3) X n ^ X ^ X n - X m 二 0 ( n，m — oo ); 

⑷ A X ， y; A y 今忍土 y n A x 土 y; 

(5) X n A x , fc 是常数 4 kX n ^ kX \ 

(6) X n ^X^Xl^ X 2 ; 

(7) X n —♦ a , Y n —^ 6, a , b 是常数 X n Y n ob \ 

⑻ ^ 1 X~ l ^ 1; 

(9) X n A a , y n Afe, a,6 是常数， X n Y -^ ab ^ } 

(10) Xn ^ X . Y 是随机变量冷 X n Y ^ XV ; 

(II) Xn ^ X . Vn -^ Y ^ X n Y n 二 XV . 

证 对任给 e > 0 , 

(1) P {\ X n - X ^0\^ e } = P {\ X n >0 

所以 

X n - X 0 (n — oo ) 

(2) P{\X - Y \^ e } = P {\ X - X n + X n - Y \^ E } 

^ p{\x n -xi^ |} + p{\x n - m |} 

—— ► 0 (n — oc ) 

由 e 的任意性得 P{X / r } = o , 所以 P{X - y } = !. 
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所以 kX n kX. 
(6) 对任给 5 > 


一方面， 

P{\X n \ ^ M} 


= P||X n | ^ M, \X\ < —I + P^\X n \ ^ M, \X\ ^ 


(3) P{\X n — X m \ ^ = P{\X n — X + X — X m \ ^ s} 

^ P{\Xn — X| > 备 } + p{\X m 

— ► 0 (n，m — oo) 

所以 X n - 0 (n, m — oo). 

(4) P{\X n ±Y n ^(X±Y)\^e} 

^P{\{X n -X)±{Y n ^Y)\^e) 
^ P {\ X n ~ X \^ £ -} + p {\ Y n - Y \^ £ -} 

— ► 0 (n — oo) 

所以得 X n ±Y n -^ X ±Y. 

(5) A: = 0, 显然成立 . 若 fc # 0 ， 

P{\kX n ^kX\ ^e} = P{\k\\X n -X\^e} 


1/ 
Hlfcl 


p \J/ 




使 

， 

数 5-4 
整 6 一 4 < 

正 < 9 
及 9 f 


5 14 5 12 


丄 M 


> ^I 

Mw I - 

純 -{'{l^h 
I, p p 
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^p{\X n -X\^^-]+p{\X\^f} 

6 S S 

< — I — = — 

4 4 2 

另一方面， 

P{\X n \\X n -X\^e} 

= P{\X n \\X n -X\^e y |X n | = 0 } 

+ P{\X n \\X n -X| 0 < \X n \<M} 

+ P{\X n \\X n ^X\^e y \X n \^M} 

^p{\X n -X\^-^]+P{\X n \^M} 

S S f 

〈 A : 5 

故 W - X n X -^ 0 . 

同理可证 X n X - X 2 — 0 . 

因此由⑷知 M — X 2 = W -X 2 

⑺由⑷， 

■^n + - y (1 b 

再由⑹， 


(X n + y n ) 2 (a + 6 ) 2 , X\ a 2 , b 2 

故知 X n Y n ab. 

( 8 ) P{\X- l -l\^e} 



\l-X n \ ^ 

^ T >£ . 

I^n —1|^ I Y .1 

—又- ^ 6j H 丨 >2 


+ 


p {^ 4 } 


..^9 . 



<p{|X n -l|>|} + p{|X n -l|>^} 

— ► 0 {ti — ► oo ) 

所以； ^ 1. 

⑼利用本题（5)，⑺，⑻的结论 • 

(10) 对任给 (5 > 0,仿 （6) 知存在 M > 0及正整数#使当 
n> N 时有 

P {\ X n Y - XY \ ^ e } 

= P{\X n Y^XY\^e y |y I - 0} 

+ p{\x n Y - xr| > e, o < |y| < m} 

+ P {\ X n Y ^ XY \^ e , | r | > M } 

^ P{\Xn + P {\ Y \ > M }<5 
故知 X n Y i XY . 

(11) 因 X n Y n —+ — xy , 由 （10) 知 

X n Y i XY 

用 （6) 及 （10) 中的证明技巧易证 

X n Y n - X n Y ^0 

故得 X n Y n -^ XY . 

【评注】本题的主要结 论是： 若二个随机变量序列都依概率收 
敛，则其和、差、积、商也必依概率收敛，这结果有时也称斯卢茨基 
引理. 

这里介绍的序列命题及证法体现出把难题分解成较容易的子 
命题，再——解决的典型思路. 

27. 设忍 A X ，而0是 R 1 上的连续函数，试证 g ( X n ) ^ 

am ， 
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证对任给5 > 0,存在 M > 0及正整数％，使当 n > iVi 时 

有 咖4 

p { lXn - x \^ f}< s - 

这时 

P {\ X n \^ M } 

= p {\ X n \^ M , \ X \<^-} + p {\ X n \^ M , \ X \> y ) 
^p{|X n -X|^y}+p{|X|^y} 

4 4 2 

又 p ( rr ) 是 R 1 上的连续函数，所以 〆 : r ) 在 [- M , M ] 一致连 
续，故对任给 e > 0,存在 r , > 0,使任意❺， a : 2 € [- M ， M ]， 且 

\xi - x 2 | < T7 时有 |^( a ： i ) - g ( x 2 )\ < e . 由 X n X ，又可知存在 
正整 数爪， 使当 n > 乂时有 

P{\x n -x \^ v }< 6 - 

于是当 n>N = max (7 V 1? N 2 ) 就有 
P {\ g ( X n )^ g ( X )\^ e } 

^ P {\ 9 ( X n )- g ( X )\^ e , \ X n \< M , \ X \< M } 

+ P{(|X n |>M)U(|X|^M)} 

(P{\x n -X\^ V } + P{\X n \ ^M} + p{|X|^y} 

〜 4 2 4 

所以证得 g ( X n ) ► g { X ). 

【评注】这条随机变量函数序列的收敛性结论，形式普遍，用 
途极广. 
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28 . 若 { X n } 是单调下降的正随机变量序列，且 I 0,试 
证 Xn ^4 0. 

证由；^为正及单调性知，对任意 e > 0， 

{|Xfc| <e} C {\x n \ < 6：}, n = fc，fc + 1，… 

于是 

{ n(|X n |<^)}D{|X,|<e} 

n=k 

故 

p { n ( l ^ n |< e )}^ P {| X fc |<6} 

n=k 

从而有 * 

oo 

l^Jim P { f ](\ X n \< e )}^ Jim P {| X fc | < 5 } = 1 

n—k 

由《概率论基础》 （5.4.17) 知 2^0. 

【评注】单调性假定下，依概率收敛与以概率1收敛等价. 

29. 若&，，…是独立随机变量序列，其特征函数均为 < p { t ), 
II 是整值随机变量， P{/i = A :} - p ky 且与 { Xi } 独立，求 r / = 
X \ + X2 + • • • + X # 的特征函数. 

解 /”(《) = Ee itri = Se it(Xl+，，，+x ^ ) 

= £ p {^ = k}E[e^ x ^'^ x ^ |/x = fe] 

fc=i 

= ^ P{/i = fc } 五 [ e u ( Xl + ••+々) |/i = A :] 

fc=i 

= y^pk E[e u(Xl +...+ Xfc) ] 

k=l 

^^ 2 pk ^ k { t ) 
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【评注】请与母函数的相应公式对照，可见特征函数也能用来 
处理随机个独立随机变量和的问题，而且此处； Q 可以是取任意实 
数值的随机变量，因而处理的范围更广. 

30.若/⑷是非负定函数，试证： （1) /⑼是实的，且/⑼ > 0; 
(2) f (- t )= Wy , (3) 1/⑴|</(0). 

证因/⑷是非负定函数，所以对任何实数 
数入1,入2, … ，入 n 有 

n n 

EE / ⑷ — i/c)AjAfc ^ 0 (*) 

fc=l 

(1) 在 （*) 中令 n = 1， h = 0, ^ = 1得/⑼彡0,当然/(0) 
是实的. 

(2) 在 （*) 中令 n = 2,= 0, h * 得 

/⑼ |Ai| 2 + /(0)|A2| 2 + /(—^) AiA 2 4- /⑷ A1A2 彡0 (**) 

从而得知 

/(— <)入1入2 + /(亡)入1入2 = /( -亡)入1入2 + /⑷入1入2 

即 

[/(t) - /( - 1)] 入 1 入2 + [/(-*) - /(i)] A1A2 = 0 

由于 Ai，A 2 是任意的，故 

m = 7 H ) 

f (~ t ) = f ( t ) 

(3) 在 （**) 中令 \ = /⑷， A 2 = -1/(01，利用 f (- 1 ) =丽即 
得 

2 / ⑼刚 2 - i /( oi 2 i / ⑹ - \m\ 2 \m\>o 

若 l/(t)| / 0,则由上式得 /(0) > |/(t)|； 

若 1/⑷ 1 = 0,由⑴知 /( o )> |/( oi . 

【评注】特征函数的性质，除连续性和规范性/(0) = 1夕卜，都 
来自非负定性. 
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31. 某理发店为每个顾客的服务时间服从均值为 1/3 (小时) 
的指数分布，可认为对每个顾客的服务是相互独立的. 

(1) 求为对100个顾客服务，总共需要31小时至35小时的概 
率； 

(2) 以95%的概率在32小时之内可服务完几个顾客？ 

(3) 找△，使该店对100个顾客的服务时间在 （33.33 - △， 
33.33 + A ) 之间的概率大于95%. 

解设为顾客的服务时间不〜 Exp (3), i = 1,2,…，100,且相 
互独立，按林德 伯格莱 维中心极限定理，& + X 2 + • • • + X 100 近 

(1) 求概率 


P{31 ^ X\ + _ • • + Xioo 《 35} 



31 


100 

丁 


10 




义1 + … + XlOO — 


10 

T 


100 

丁 



二 步 (0.5) — 少(一 0.7) 
= 0.449 5 


(2) 提示 ••求 n . 

答81个. 

(3) 提示： 求 偏差. 

答 △ = 6.54 (小 时). 

【评注】为林德伯格-莱维中心极限定理特设的数值褊子，务 
必自己完成.请与频率估计概率的三类计算（亦可参看习题五 17, 
I 5 , 18 题）问题作 比较. 

32. 若总体$的数学期望 = m, ^ 抽容量为 n 的样 

本，求其平均值 乙 为使 P {\^ - mj < O.I^t} 彡 95 %， 问 n 应 取多大 
值？ 

提示： 大样本场合，用林德伯格 - 莱维中心极限定理，化为正 
态逼近求 n . 
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答 n 取 385. 

【评注】抽样调查方案设计时的基本计算. 

33. 用特征函数法直接证明棣莫弗-拉普拉斯积分极限定理. 
证以 / in 记 n 次伯努利试验中成功出现的次数，则它服从 
二项分布 B ( n , p ), 其特征函数 / n ( t ) = ( 9 + pe u ) n ， 由此 

y/npq 

的特征函数为 

ffn (亡） = 


it -.r, - ripit 

V n PQ y/npq 
e 


q+pe 


P lt _gJJ 

y/npq y/npq 

qe +pe 


n 




2np 


M L n 


" 2 ) 


n 


t 2 / r\i 

2 H +0 \ n )\ 


t 2 


一 if 2 

可见 9 n { t ) ― ► e 2 ， （n — oo ). 

用连续性定理即证得様莫弗-拉普拉斯极限定理. 

【评注】经典的定理，标准的证明. 

34. 若{匕， n = 1，2,… } 为相互独立随机变量序列，具有相同 

分布 

尸{6» = 1} = ■ ， P{^n = 0} = ^ 

而加 = f ||，试证加的分布收敛于 [0, 1] 上的均匀分布. 

fc=i 

证& (j = l ，2, …；)的特征函数为 

域)= i ( e u + l ) = +3”# = COS 备 # 
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这样 _ 的特征函数为 




Mr 


= cos 


2fc+i 


e 


从而 TM 的特征函数为 

/tmW =cos‘cos 各 … coSf^e 1 * ( 开 + 获 +_ + F TT ) 


1 sin I t( 1- ^) 

2 n sin 2 ^tt 6 


由此得 

而 ^( e u - l ) Ji [0,1] 上均匀分布的特征函数,故再用连续性定理 
即证得本题结论. 

【评注】本题建立了 [0, 1] 上均匀分布与 [0, 1】上的数的二 
进制展开以及可列重伯努利试验之间的关系.这个模型导致许多深 
刻的研究，包括博雷尔强大数定律.参看教学札记之二十七 “[0, 1] 
中数的#进制展开与概率论”. 

35. 用特征函数法证明二项分布的泊松逼近定理. 

证成功概率为 p n 的二项分布的特征函数为 


fn{t) = (p n e u + g n ) n = 



np n (e [t 一 l) ] n 
n 


若当 n — oo 时， np n —► A , 则 


lim f n {t) = exp [A(e u - X)] = f(t) 

n— J 

而 /(<) 是泊松分布的特征函数，故而得证. 

【评注】试与课文中用母函数法的证明作对比. 

36. 用特征函数法证明，泊松分布当 A — 00时，渐近正态分 


布. 
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证设 6 服从参数为 A 的泊松分布，则其特征函数是 


令 


Vx 


A 


/“⑷ = exp [ 入 (e“ - 1)] 

，则％的特征函数为 
t 


VA 

/』)= 〆 、(忐) 


exp 


exp 


exp 




iVxt + A(e > — 1) 


— i^Xt + i . — A 

[.‘)] 


2A 


入 + 


°( 長 ) 


lim frj x (t) 

A— KX> 


=e 


4 


所以得泊松分布在 A^oo 时渐近正态分布 AT(A,A). 

【评注】有名的结果，但也在意料之中. 

*37 • 若 {Xi} 是独立同分布随机变量序列，其分布分 别为 : 
(1) [-a, a] 上的均匀 分布； （ 2) 泊松 分布； （ 3) r 分布，记 




- EXA 
i=i 



Y. DX i - 


试计算的特征函数，并求 n — oc 时的极限 . 

解 （ 1) 设 & 服从 [-a ， a] 上的均匀分布，其特征函数为 


fxjit ) = 


sin at 
at 


又 


叫= 0 ,叫」 〆 ， = 

j=i 
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所以 


exp 


— iiVnA + ifVnA -皆 + o(l)j 


exp 


[^ — — + o(l) j — ► e - 皆 (n —► oo) 
⑶设 A 服从 r 分布 r ( a ， 奶，其特征函数为 
fxi (t) = (l - , 0 >o 


又 


EXj 


a 

召， 


DXj 


a 


炉， 




n X 一笔 
_ 0_ 


fy n ( t ) 


fXj 




n 




n 


- & 2 + 4 )r 

士 4)r 一 “ 


oo ) 


(2) 设 X , 服从参数为 A 的泊松分布，其特征函数为 

/x i (i) = exp[A(e it -l)] 


又 


EXj = A , DXj = A ， y n = JZ 


Xj-X 

ti V^A 


n 


o 


?t 2 lnA 


12 




p 


t 


♦ 1 *1 
I I 

/— \ X - \ 

p p 




所以 



fvAt ) 


exp 


i - 伽 


1 一 i 


y/na 

exp (- - 士 ) 


) 


■a 


-na 


ln/yjt)= 


— ity/na — na In 



-i ty/noi - na [ - ]^= + — + ofi 

L vna 2 na \n 


e _ 

2* 


(n —♦ oc ) 


从而亦有 / y n ⑷一 ► e~V (n — oo ). 

【评注】对不同分布，用标准方法，达相同结论.充分显示出特 
征函数法在证明中心极限定理中的威力.第五章 §3例4为⑴提 
供 直观； 注意到泊松分布的再生性可知 （2) 与上题关系密切. 

38•设 { X n } 独立同分布， P { X n = 2 k ~ 2lnk } = 2^ (k = 
1，2，.")，则大数定律成立. 

证 EXi = [2 fc _21 nfc 2- = ^ fc - in 4 

k=l k=l h=l 


因 ln 4 > 1，所以 f >— ln 4 收敛，即五兄存在，由辛钦大数定律即 

k=l 

知对 { X n } 大数定律成立. 

【评注】独立同分布场合首先想到辛钦大数定律. 

*39 •若 { Xi } 是相互独立的随机变量序列，均服从 iV (0， l )， 试 
证 


W n = Vn 




Xi + • • • + 

渐近正态分布 AT (0,1). 


及^ 


X \ + • • • + X n 
々 + •••+ 巧 


证 ⑴设匕 = = 5亡<，由题设条件用正 
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态分布的再生性得 


歸， 1) 


用辛钦大数定律得 
又 


Vn 上 



Vn 


由斯卢茨基定理（见本章习题 25) 知％渐近正态分布. 

⑵由 （1) 得1，又由本章习题 27 可知# - ^ 1且 


U n = 



y/Vn 


同样用斯卢茨基定理得渐近正态分布. 

【评注】同类题型问题甚多，在数理统计中有用，证明方法也 
很有教益. 

M 0, 设 X l 5 X 2 ,-.. 是独立随机变量序列，均服从10, 1] 均匀分 
布，令 

z n ={ i \ x t )- 

试证 Z n 二 C , 这里 C 是常数，并求 C . 

证 

又 

ElnXi = j In x dx = (xlnx 一 $) |。 ^ —1 


1 n 

luZ n = — InXi 


d X 
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由辛钦大数定律知 lnZ n ^- l , 因而利用本章习题27即得 Z n ^ 
e - 1 (n — oc ). 易见 (7 = e - 1 . 

【评注】独立 [0, 1] 均匀分布随机变量的几何平均值必收敛于 

e - 1 • 

Ml •若 { Xi } 是独立同分布随机变量序列 ，五尤= m ，而 /㈤ 
是一个有界的连续函数，试证 

lim ：，+ Xn )1 = f ( m ) 

n—^oo \ xi / J 

证 由科尔莫戈罗夫强大数定律得 

~ (Xi + X2 + • • • + 义 n) ^ > EXi = m (n —♦ oo) 

又因 /(X) 有界，由控制收敛定理和/⑻的连续性,则有 

lim … + 4 )1 = E \ Um f( Xl + '" + Xn )] 

n—^oo \ 71 /」 Ln—oo V n / . 


E 


/(lim 

\ 71 —OC 


X\ + ••• + X n 


n 


二 /㈣ 

【评注】请特别注意所给条件的使用. 

M 2 •若{ X ,}是独立同分布，具有有限二阶矩的随机变量序列， 
试证 

2 


n 




p 


n{n+l) f 

l — x 

证记 EXi = a, DXi = a 2 , jJJlJ 
2 A —\ 2 


EXx 


E 




n(n + 1) ' V n(n + 1) f 

2 ^ ... \2 4 


J 2 iEX i 


a 




n 


n 2 (n + l) 2 

i — 1 

2(2 n 4 - 1)( J 2 
3n(n +1) 




-> 0 (n —► oo) 
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故 


2 

n(n + 1) 


71 

i=l 




因此由《概率论基础》定理 5.2.8 推出 


2 

n(n + 1) 


t=i 


^a = EX l 


【评注】通过 r 阶收敛证明依概率收敛的一个例子，常用于数 
理统计中相合性的证明，本题亦有统计学背景. 

M 3 •设 Xx , A ： 2 ,... 相互独立，均服从柯西分布 p ( rr ) = i _ 

7 t 

:试证它们不满足格涅坚科关于大数定律的充要条件（见本 
I + x z 

章习题9)，即要指出，当 n — oo 时 


E 




证 由柯西分布的再生性(参看第四章习题 *49) 知的 

i=i 

密度函数为因而 




X 2 1 71 

n 2 + x 2 71 n 2 + x 2 


dx 



u 4 


(1 + u 2 ) 2 


dw 


(x = nu) 


1 r °° u d 1 
JT J-oo 2 1 + U 2 
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【评注】柯西分布奇怪性质之一是其平均值 々 ■ +••• +、 与 

U 

X l 同分布（见第四章习题51)，因此不可能服从大数定律.另外它 
根本不存在数学期望，大数定律这时按《概率论基础》 （5 丄 9) 定 
义. 

M 4. (魏尔斯特拉斯定理的概率论证明）设 /( x ) 是[0, 1] 上 
连续函数，利用概率论方法 证明： 必存在多项式序列在 
[0,1] 上一致收敛于 f ( x ). (提 示： 定义伯恩斯坦多项式 

m=0 \ ’ 

并利用大数定律 .） 

证 f { x ) 在10, 1] 上有界且一致连续，因而存在 M > 0,使对 
一切0 < a : < 1有 \ f { x )\ ^ M , 并且对任意£>0,存在5 > 0,对 

任意0彡 x，y 彡 1，只要 | a : - y | < 6 ,就有 \ f ( x ) - f ( y )\ < 

依提示定义 B n ( x ), 容易验证， B n (0) = /⑼，队⑴=/( I )，因 
而只要考虑0 < rr < 1. 对每一固定 re , 设想一伯努利实验，使事件 
A 在每次试验中出现的概率恰为: r ， 并以 tm 表示前 n 次试验中4 
出现的次数，则 B n ( x ) = E / fj^y 

对上述的5,由伯努利大数定律有 

lim p { V^-x ^ S }=0 
n—>oo LI n ) 
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又因 

f ( x ) - B n { x ) = 0(1- x ) n —[/( x ) - /0. 

m=0 \ ’ 

=咖)-/(夸)] 

⑷ -，($) 昤 H <5 
+ p {5— 和令 [/ ⑷— /(》) 昤 w 

于是 

l /( x ) — 万71(工)| ~~ X 彡 2从 （*) 

这就得到 lim B n ( x ) — f ( x ) 对每个0彡 a : 彡1成立. 

n ― ^oo 

利用切比雪夫不等式 

nf Vn ^ ^ A ^ Dr ln _ Tix{l - x ) ^ 1 

P i: - $ >5 J ^^2 = ~U^ ^ 4^ 

当 n >^ 时，由上式及 （*) 式得 

sup \ f ( x ) - B n ( x )\ < e 

O ^ x^l 

这就证得了 B n ( x ) 在 {0,1] 上一致收敛于 / Or ). 

【评注】著名的分析定理，巧妙的概率证明. 

45•设 { X n } 是独立随机变量序列，试证 X n ^%0 的充要条 

oo 

件为对任意 e > 0,有 L P {| X n | ^ s } < oo . 

n=l 

证充分性：因为 P {\ X n \ ^ 6} < OO, 则由博雷尔-康特 

n=l 
oo oo 

立引理⑴知尸{ n u ( ix n i ^ s )} = o , 这正是表明 

n=k 


0 (n —> oo ). 


• 367 . 



必要 性:若 -^0, 则应有 p{ p| 0 (\ X n \ ^ e )} =0. 

k—^ 1 Ti^^k 

用反证法，假设 f ； P {| X n | ^ = OO, 则由博雷尔-康特立 

n=l 

引理⑼及 { X n } 的独立性得 p { f| 0 (HI M } = h 这就导 

/c=l n=A: 

致了矛盾.所以独立随机变量序列忍^ 0时，有 f ； P {\ X n \ ^ 

n=l 

e } < OO . 

【评注】给出独立随机变量序列以概率 1 收敛的一个简明而实 
用的充要条件.证明过程也显示博雷尔-康特立引理的强大威力. 

46. 试证独立同分布随机变量序列，若存在有限的四阶中心矩， 
则强大数定律成立. 

证 因存在四阶中心矩，故数学期望和方差亦存在，由独立同 
分布场合的科尔莫戈罗夫强大数定律即得结论. 

也可用博雷尔-康特立引理来证.设 EXi = a , DXi = a 2 , 
E(Xi - a ) 4 = c 4 , 由马尔可夫不等式得 

*=1 »=1 


( Xi "" a ) 4 ] + (不-^⑷ - * 1 ) 2 } 


l + 3a 4 
n 2 e 4 


nC4+6 .!i^y 


其中因独立性有 E { Xi - a)(Xj - a ) 3 = 0 (i / j ), 最后一步成立 

1 4 . ri a A 

是因为 c 4 有限，当 n 充分大时定有 c 4 < n ， 而;^ < oc ， 
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所以 


^ < OC 


E p {|-E^- a 

n=l i=l 

由博雷尔 -康特 立引理 

^{nu|^E^-|^}=o 


k=l n=k 


所以 i + • • • + X n ) a , 强大数定律成立. 
n v ’ 

【评注】本题的证明平行于博雷尔强大数定律.使用博雷尔- 
康特立引理，要证明相应的级数收敛，用切比雪夫不等式或二阶矩 
是不够的，这时用了马尔可夫不等式与四阶矩，顺利完成. 

总之，博雷尔-康特立引理和马尔可夫不等式是证明以概率1 
收敛的主要工具. 

顺便指出，自科尔莫戈罗夫建立独立同分布场合的强大数定 
律，数学期望的存在性成为充要条件，只需简单加以验证即可.因 
此本题的命题含义当然是要求从最基本的事实出发证明历史上早 
就发现而有意义的一个强大数定律，也即本题是插在《概率论基 
础》 §4 第二小节之后，第三小节之前的一道练习题. 

47. 本章习题6的各个独立随机变量序列是否满足强大数定 
律？ 

解⑴注意到 P { X k = ± 2 k } = EX k = 0. 假定 {&} 满 
足强大数定律,则有 

^ ( 义 1 + …+ X n ) > 0 

亦有 

- (^1 + • • • + 一 1) = - • ― (Xi + …+ X n _i) > 0 

n \ ’ n n — 1 v ’ 

由上述两式得 
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但由 { X k } 的分布，以概率1有 L f > 1,这显然与 

n n 

- X n -^0 矛盾，因而对这个随机序列强大数定律不成立. 

n 

(2) DX k = 1,由于 



k=l fc=l 


所以本随机序列满足科尔莫戈罗夫强大数定律成立的条件. 

(3) 注意到本章习题 4 5 的结论，对独立随机变量序列 { X n }， 

oo 

X n ^0 Ve >0, ^ 2 P {\ X n \^ e } <oo 

n=l 

取 m = I ， 则 

n=l n=l 

= f ； P {| X n |= n } 

n=l 

OO OO - 

n=l n=l 

发散，所以 牛0, 因而推出 \ x x +…+ x n ) 牛0,故这 

个随机序列不满足强大数定律. 

【评注】独立而不同分布场合，强大数定律成立并未找到充要 

条件，而科尔莫戈罗夫条件 < oc 是目前找到的最好充分 

Aj=1 

条件，因此要验证成立，就验证它.若要验证不成立，只好各昱神 
通，如本题 （1) 及 （3). 

48. 举例说明博雷尔-康特立 引理⑴ 之逆不成立. 
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解设力1〕乂2 3 • • • D An 3 • • •，且 P (4 n ) = —，贝 1 】 

71 

p {^ A -}= p {nu^} 

n = lfc=n 

= p { f | A n } 

n=l 

=lim P ( A n ) 


lim 一 = 0 

n—^00 Tl 


然而 


E p (^) = E- = ^ 


故博雷尔-康特立引理 （ i ) 之逆并不成立. 

【评注】一定要举非独立随机事件序列的例子！为什么？ 

49.设 { X n } 是相互独立且具有有限方差的随机变量序列，若 




则必有 


lim DX k = 0 

n—»oo 

k=l 


DX 


证因则对任给 e 〉0, 存在正整数 iV ， 有 


oo 

E 

fc =/ V+l 


DXk 


< E 


当 n > AT , 


0 ^ ^ S DXk 
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^T, DXk + ^ E DXk 






fc=N+l 


1 f nr f DX k 

^^H DX ^ + E -fcT* 


k=N-{-l 




DXk + ^ 


对固定的 N , 当 n 充分大时,上式右边第一项可以小于故而有 


DXk = 0 


【评注】这是一条纯分析的结论，但是在独立和的大数定律中， 
前者是科尔莫戈罗夫关于强大数定律成立的条件，而后者是马尔可 
夫关于（弱）大数定律成立的 条件. 

*50 •设 /( x ) 和 #(2：) 在闭区间[0, 1 ] 上连续，且满足0彡/⑷< 
Cg ( x ), 这里 C 是一个正常数，则成立 

1 ：^ f 1 f 1 r 1 fM + f ( x 2 ) + -- + f ( x Tl ) ^ ^ 


*0 Jo Jo ^(^l) + 3 ( 工 2) + • • • + g(^n) 
f f{x)dx 


decide … dx ? 


g ( x)dx 

Jo 

证设独立随机变量序列之每个变量均服从10,1 ] 上均 

匀分布，因 /( x ), g ( x ) 在闭区间[0，1]上连续，故积分 f f ( x ) dx , 

Jo 

存在.因而由佚名统计学家公式得 


Em )= j(x)dx 
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亦存在有限，同样 Eg ^) 也存在有限. 

于是独立同分布随机变量序列 { m n )} 满足强大数定律，有 

p { n lim ^ ( m ) + …+ /(“)）= Ef (^)} = 1 

同样有 

P { ⑸ + …+ 秦 )) = 五必)} = 1 


作 

n 二 /⑸+…+ /⑸ 

71 ff ( Cl ) + * ' • +5(《 n ) 

由0彡 f(x) ^ Cg(x) 知0彡 r? n 彡 C ， 且 《 n ，/( Cn ), ^( Cn ), Vn 

(n = 1,2,..*) 是定义在同一概率空间（仏多， P ) 上的随机变量， 

故而由多维佚名统计学家公式知 

Eti - f [ 瓜 ) + ••• + 瓜 ) 

~ 一五 + …感 ) J 


于是 




f{xi) + -- + f(x n ) 
9(x1) + - h g{x n ) 


drci … dx n 




f(xi) + -- + f{x n ) 

9{^ i ) + - • + 9{ x n ) 


dxi … dx n 


=lim E Vn = E ( lim Vn ) (控制收敛定理) 

n 一 ^oo n — ►oo 


= E \ lim 


士 (/(6)+ ••_ + /(&))- 

^( 5 ( 6 ) + … + 5(60) - 


_ 观 o — I f{x)dx 

骑 l} (%0r)dr 

Jo 

[ 评注】一个趣味式的分析问题用概率论的方法给予严格证 


明 • 
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51. 设…是独立随机变量序列，对它成立中心极限定 
理，则对 { X n } 成立大数定律的充要条件为 D ( X 1 + ... + X n ) = 
o(n 2 ). 

证充分性••设 D(Xx +…+ X n ) =: o ( n 2 ), 则由切比雪夫不 
等式得 

♦七 平 1 忘广 〜 — Q (n 一 。 o ) 

i=l 

所以大数定律成立. 

必 要性： 设对 { X n } 成立中心极限定理，即对任意的 A > 0,有 

；|§(不 -现) 1< +忐⑴ 

其中 + 又对 {x n } 成立大数定律，即对任 

给 e > 0,有 

n ^^|E^-^)|<e} = l (2) 

1=1 

注意到 

p {^| E ^- e ^)|< £ } 

i=l 

i — 1 

i 二 1 


由此利用 （1)， ⑵两式可得，当 n — oo 时应有^ 



— > 0,从而得 D { X \ + • • * + Xn ) = o ( n 2 ). 

【评注】 D(Xi + ..* + X n ) = o ( n 2 ) 就是著名的马尔可夫条件 


(5.1.13)， 它是大数定律成立的充分条件.本题表明，在独立和 场合， 


若成立中心极限定理，则它也是必要条件. 
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52 .设 A ， 义 2 ,…是独立同分布随机变量序列，且+ [為 

对每一个 n = 1，2, … 有相同分布，那么，若 EXi = 0, = 1，则 

Xi 必须是 iV (0,1) 变量. 


证 


当 n = 1时， 


-^ J 2 x k 即为义1，所以如果/⑴是足的 


特征函数，那么根据题设/⑷也是 



X k 的特征函数，并且 


fc=l 


对每个 n 均成立，又 


/ (^) =1 + i£Xl ^ + 


i 2 EXl 
~ 2 ~ 




则有 



(n — oo ) 


所以尤〜 N (0，1)- 

【评注】正态分布的又一个刻画性质. 

53 •设 { X k } 是独立随机变量序列，且為服从 AT (0, 2 _ fc ) ，试 
证序列⑴成立中心极限 定理； （2) 不满足费勒 条件； （3) 不 
满足林德伯格条件，从而说明林德伯格条件并不是中心极限定理成 


立的必要条件. 

证 （1) 因为為服从正态分布，所以 


^- iz xk 对每个 n 都 

fc— ^ 1 


服从#(0，1)，因此中心极限定理成立. 
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( 2 ) n oo oo - 

B l = Yl b l = = 1 

A;=l fc=l k=l 


B\ —/->oo (n — oo) 

所以不满足费勒条件之《概率论基础》 (5.5.4). 
(3) a k = EX k = 0, T 1•取 t = 1 得 


自 * L|>t 


B n 


x 2 dF k { x ) > x 2 dF Y { x ) = C >0 


'| x|>l 


因此 


lim ( x - a k ) 2 dF k ( x ) ^ 0 

n—ooB n fc=1 J\x-a k \>TB n 


故知不满足林德伯格条件. 

【评注】本题以反例形式对林德伯格-费勒中心极限定理作出 
补充说明： （1) 林德伯格条件不是中心极限定理成立的必要 条件; 
⑵费勒条件不能由中心极限定理推出. 

54 •若 { X k } 是独立随机变量序列， Xi 服从 [-1,1] 均匀分 
布，对 A : = 2,3,…， Xfc 服从 AT (0, 2&- 1 )，证明对 { X k } 成立中心极 
限定理但不满足费勒条件. 

证肌= 0, S 卜 • +史 2 fc - 1 = 2 n 一鲁，又的特征 

k=2 fc=l 

函数为 

fit ) = n ’ 心⑷=亨 n ^ ^ 2 fc_i < 2 } 

fe=l fc=2 


* ^76 • 



由飢 = 7 ^卜 的特征函数为 


g(t) = sin 


t 

v/2 n : 5/3 


^ - 5/3 f (2 - - 2) q 

t P \ 2(2^ -5/3) J 




因而得 a iV ( 0 , l ), 所以中心极限定理成立. 
然而尽管 

9 „ 5 

= 2 n - 3 00 


但 


及 = 2 n _i 

琢一 2 -- 5/3 



(n — > oo) 


所以不满足费勒条件之《概率论基础》 (5.5.5). 

【评注】当然本例中的 { X k } 也不满足林德伯格条件，因此本 
例要说明的问题与上例完全相同，差别在于上例因 + oo 而不 
满足费勒第一个条件，而本例则不满足《概率论基础》定理 5.5.1 
中的费勒第二个条件. 

通过上题与本题，让读者对林德伯格-费勒中心极限定理的成 
立条件有更好的理解. 

*55. 在泊松试验中，第 i 次试验时事件 4 岀现的概率为仍,不 
出现的概率为〜各次试验是独立的 ，以〜 记前 n 次试验中事件 
A 出现的次数， 试证： 

(1) ^ ^ 二0; 

TI 

( 2 )对 M 成立中心极限定理的充要条件是 f^PiQi = + oo . 


证记 


r 1 ,第 i 次 a 出现 
to ， 第 i 次 4 不出现 


则 
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P{Xi = 1} = Pi , P{Xi = 0} = (Ji 
而 = Xi + ••■-(- X n . 

1 n 、 l 

(1) 易知 Pi % = Pi(l — Pi ) 彡 因而 Di/ n = y^pjgj < $ n . 由 

i=l 

切比雪夫不等式得 

o f ^ 71 一 EVn 、 1 〆 1 Dl/ n 〆 1 n 

P \ — n ~~ 叫 ㈤ — 0 

所以 

t/ n ^ Ev n _p^ o (n — ㈤ ） 
n 

这就是教科书中提到的泊松大数定律. 

(2) 充 分性： 

71 

易知 max |Xjj < 1,用 假设坑 = Di/ n = ― ► oc , 得 

1 1=1 
lim — = 0 

n—>00 B n 

由《概率论基础》定理 5.5.3 即得对〜成立中心极限定理. 

oc oo 

必要性：用反证法.假设 J 2 p iqi 收敛，记 s 2 = Ylp ^ 

i=l i=l 

n 

B 2 n = 冲，易知 { BD 单调上升， B 2 = lim 纪.乂记 

71 一 00 



ic _ Ei/ 

〜取0，1，2,…， n ， 则 Z n 可取 一 — fc = 0， l ，2，."， n , 相邻 

-On 

值之间隔为^•由 { BD 单调上升并以 B 2 为极限，可知对 Vn ， 
bn 

B n ^ B . 于是就有，对所有的 n ， Z n 所有取值的间隔不小于 
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这样的 A 的分布函数不可能收敛到标准正态分布.如若不然， 
假定依分布收敛到标准正态分布，则由本章习题 *20 知这样的 
收敛是一致的，于是对每个 n 总可取到 区间心 =(〜，)，例如可 
取 

n n 

Ea 1 

^ t==1 Bn i=1 ， b n = a n + — 

这样的 / n 中不含厶所有可取的数值，即 

P { a n < Z n < b n } = 0 

但由心 的分布函数一致地收敛于标准正态分布，推得 


P{a n <c Z n < 


y /2 n 


•6 n — 萼 

e du —— > 0 (n —> oo) 


由此得 


\/2jz 


… 2 f 

e du —— > 0 (n — oo) 


这与任意 n , 6 n - a n = 相矛盾，所以 Z n 不可能依分布收敛于 

Zn 

标准正态分布，即对 K } 不成立中心极限定理. • 

【评注】对泊松试验完全搞清两种极限定理成立的条件. 

56.设 { X k } 是独立随机变量序列， Xfc 服从[一 k ， k ] 均勻分 
布，问对 { X k } 能否用中心极限定理？ 

解 a k = EX k = 0 9 DX k - ifc 2 

Bl = f^DX k = \jZ k2 - 忐 ♦ + l)(2n+ 1) 

k=l 

对任意 T > 0, 有 

-^2 f x 2 dF k (x) 

B n ^ J|x|>rB n 
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x \ x 2 fk { x)dx 




E ^ 3 


4rS2 


k : 


18 曼 


n 2 ( n + 1): 


4 t [ n(n + l )(2 n + 1)]5 
18^ n(n + 1) 


0 (n — oo ) 


16 r (2 n + l ) y / n(n + l )(2 n + 1) 

林德伯格条件成立，故 { X k } 适用中心极限定理. 

【评注】《概率论基础》定理 5.5.3 也可用于本题，可见它是 
一种便于使用的中心极限定理类型. 

57. 试问对下列独立随机变量序列，李雅普诺夫定理是否成 
立？ 



-Vk 

y/k 


0 k a 

⑴知 • 

1 

1 (2) 

1 

1 

1 


2 

2 

3 

3 

3 


解⑴ EX k = 0, DX k = k 

\ n i n + !) 

k=l 

取 = 2,则 

1 V - v i2+2 4 n ( n + l )(2 n + l ) n — 、 


邡 - 6 n 2 (n+1) 

所以李雅普诺夫定理成立. 


( 2 ) 


2 


EX k = 0, DX k = 
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又函数 x 2tt 和 ( x +1 ) 3q 单调上升，在0： € [ fc — l ， fc ] 有 ifc 2a 彡: r 2a ， 
fc 3a 彡 (x + l ) 3tt , 于是 

= S f? 2adX 也二广如 = io 、、 



(x + l) 3Q dx = 




. n+l 


x 3a dx 


2 


砥 lX> 2a > 


2 


k-- 


3(2 a + l ) 


n 


2 a+l 


取 5 = 1, 得 

▲4 寧，、蛣 



9 r ^+1 

" 3adx 

^ v / 3(2 a + l)i /(n + l ) 3 ^ 1 1 \ 

、 > ^ x / n 3(2 a+ifv ~ 3 a + 1 3 a + lJ 


+ 0 (n —► oo ) 


同样李雅普诺夫定理成立. 

【评注】李雅普诺夫条件是历史上最早找到的一个使中心极限 
定理成立的便于使用的充分条件，至今仍有实用价值. 

*58. 求证：当 n -► oo 时 



证设独立同分布随机变量序列 UrJ 均服从 r 分布 r (^， 9， 

HO E^i = 1, D^i = 2. 
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由 r 分布的再生性知 ” n = 亡 a 服队 r 分布 r(i 备)，且 

/ c = 1 

Erin = n, Dr) n = 2n. 由林德伯格 - 莱维中心极限定理， 


p(Vn-n 


< = P{r/ n < n + tV2n} 


i+t>/2n 


(■) 


2 


10 


r 


(I) 


X 


2 


"e'^dx 



【评注】用概率论方法证明一个分析结果.注意到如〜；^，因 
此本题等价于；^分布渐近正态分布. 

• 59 . 独立随机变量序列 {^}, 对一切 fc, ^ 以概率 4 分别取值 
± k % 

(1) 试证当 s | 时，大数定律 成立； 

(2) 试利用中心极限定理 证明： 当时，大数定律不成立 . 

证 （ 1) = 0, = fc 2 ' 当 s < $时计算得 

占乃 ( 亡 6：) = ▲ffc 2 * < =n 2 *- 1 一 0 (n — oo) 

k=l k=l 

满足马尔可夫条件，所以大数定律成立 . 

(2) 对 <5 > 0, 
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成 +(5 ~~ a fc | 2+<5 = 


十 < 5 ) 


As=l 


(±^ 


ki 




n «(2+5 )+l 
( n 2 ^!) 1+$ 

^2aH-a<5+l 
_ n 2s+ad+f + l 

= —— ► 0 
n5 

即 {6} 对任意 s 满足李雅普诺夫条件，故对它总是成立中心极限 
定理 • 

在 O ■时， 

a k = E^ k = 0, ^1 = ^2 D ^k = ^2 fc2s 

fc=l k=l 

对任意 e > 0,有 

V|2 c^nrfi Oc-2^2 

2e 2 (n —► oo) 


e 2 n 2 e 2 n 2 e 2 n 2 2e 2 n 2 
- < - TT — 


Bl f> 2S ； f > 咖 +1) 

fc=l k=l 


这样当 n 充分大时 ， g < y / 3 £) 且有 



= P { 

A:=l 



B n 


< £ 


k - 


= p {^ lg “ l <£} 

fc=i 
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因而， 


k—l 


< < 


xi 


y/2n 


e 


dx = A < l 


所以， > ^ 时对大数定律不成立. 

【评注】大数定律能否成立，矩或尾端概率起重大作用，概率 

分布 



一 k 3 


1 1 

2 2 


是一个典型例子 ， s = l 是成立与否的临界值，仅对比它小的 s 值 

△ 

才成立.据此可见对本章习题5成立，习题6 (1) 不成立. 

本题 （2) 的证明思路与习题五51题紧密相关，当 2 s 彡1时， 

B \ — ^ k 2s — o(n 2 ) 不成立. 

k~l 

*60. 用概率论方法 证明： 当 n — oo 时 ， f ^ 

k=o k, 

证 设有独立同分布随机变量序列 {&} 服从 A = 1的泊松 
分布，由泊松分布的再生性知 Vn = ^ k 服从参数 A = n 的泊松 

矢 =1 

分布，即 

P{Vn = k} = ^ e -n , (fc = 0,1，2, •. •) ，且 Erj n = Dr] n = n 
由林德伯格-莱维中心极限定理， 

v A :=0 
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[ 评注】用概率论方法证明分析结果的又一有趣的例子. 



习题总评 


第五章理论性较强，因此习题的选择主要是配合正文.许多题 
目是为加深对正文的理解而配置的.有些提供正、反例证，有些提 
供应用题,有些则作了解释或补充.不但对主要结果而且还对主要 
方法设置相应的题目. 


用切比雪夫型不等式证明大数定律和用特征函数法证明中心 
极限定理是两大主题.不少题目是对导出的一些充分条件的验证. 
各种收敛性也带来一大批题目. 

关于极限定理的计算题，本质上只有那么几种类型，希望做完 
之后自己做个小结. 


L 章后小议丨 

三段式展开的结构，当然多花时间，因为前者是后者的简单特 
例，证得后者立即推出前者，从一般到特殊的讲法肯定可以节省时 
间.但是三段式的结构也不浪费时间，因为学到更多知识，了解更 
多历史，有助于拓宽眼界. 

伯努利大数定律原始的证明是纯分析的，在 Uspensky 的书中 
有介绍.《概率论基础》中它是作为切比雪夫大数定律的特例推 
出的，立刻又用切比雪夫不等式直接证明.泊松大数定律（它是独 
立而不同分布的代表）也类似处理.在矩法发明后，当然没有必要 
在教本中写出繁复的分析证明.但棣莫弗-拉普拉斯定理在书中是 
用斯特林公式直接证明的，得到了 “副产品”局部极限定理，它有 
许多应用，也存历史原貌. 
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独立同分布场合极限定理的证明，一用特征函数就相当简单 
明了. 读者将在此场合体会证法的要点，为以后讨论更复杂的场合 
作好准备. 

对上述两个场合所得结果的有关应用，特别是结合数理统计， 
新版作了较充分的 介绍. 于是读者对概率论成为统计学的理论基 
础，将有更深的认识. 

《概率论基础》第五章中的收敛性一节，完成了两大任务 .一 
是证明了特征函数与分布函数对应的连续性定理，为特征函数成 
为研究概率极限定理主要工具打通了最后一道关卡.二是提出随 
机变量的四种收敛性，为拓广概率论的研究领域摆开阵势.作为 
“副产品”，顺带证明了波赫纳尔-辛钦定理与赫格洛茨定理，前者 
给出特征函数的充要条件，后者在平稳随机过程论中起重要作用. 
最后，新版给出帕斯卡分布逼近埃尔朗分布的一个证明，给等待时 
间分布对比作一个小结. 

多元中心极限定理经常被引甩但少见证明.本书巧用前期积 
累的知识，轻松给出. 

承继复旦教科书的传统,《概率论基础》对连续性定理及波赫 
纳尔-辛钦定理写出详细的证明，这部分内容应由任课教师自主取 
舍. 最后两节也是如此，或许博雷尔-康特立引理及博雷尔强大数 
定律应列入讲课大纲. 


本章讨论的概率极限定理可列表分类 如下: 



大数定律 

强大数定律 

中心极限定理 

伯努利试验 

伯努利〜 

博雷尔〜 

棣莫弗-拉普 拉斯〜 

独立同分布 

辛钦〜 

科尔莫戈罗夫〜 

林德伯格-莱维〜 

一般场合 

泊松〜 

切比雪夫〜 
马尔可夫〜 

科尔莫戈 罗夫〜 

林德伯格-费勒〜 
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教学札记之二十五 I 

统计学和概率论 
一、数理统计的理论框架 



一个典型的统计问题可描述 如下： 进行一系列随机实验,从实 
验中收集到数据，任务是从这些数据中提取信息，解释结果，并作 
出某些结论. 

所考察对象全体称为总体.例如它可以是全市收看有线电视的 
家庭全体，也可以是某种电子元件的使用寿命，这个总体有时还可 
以是想象中的，例如使用某种抗癌新药的潜在患者全体. 

一般对总体关心的是一个数量指标，例如，某频道收视与否，寿 
命，五年存活率等，因此通常用一个随机变量 X 来等同一个总体. 
若关心的是多个指标,则归人多元分析这一统计分支，此处不论. 

为了了解总体的这个指标，可以对总体中的每个个体作测量， 
但或由于总体太大力所不能及或花费太多，或测量带有破坏性，或 
带有潜在性，通常抽样是唯一可行的方法.这时得到总体的一个样 
本. 统计学的任务是通过这个样本 X r 、 X 2 、 …、 X n 来对总体 X 作 
出种种论断，称之为统计推断，有时则还作出某种决策，这时还得 
考虑采取相应行动的后果. 

统计学中假定样本依某种随机方式从总体中抽取以保证它对 
总体有某种代表性，从而使推断有意义，这时概率论成为统计方法 
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的理论依据. 

这样一来，统计学成为一门归纳的学科，它从某些经验事实出 
发，对总体作出结论，即从部分推断总体.但这正是一切实验科学 
所必经之路，因此统计学成为从实验数据到构建理论模型的主要 
科学工具,这就决定了统计学在现代科学体系中的重要地位. 

相反地，概率论则是一门演绎的科学，它从某些公理化的事实 
出发,利用形式逻辑作推理,建立自己的理论体系. 

概率论与数理统计就是这样相辅相成：概率论直接用于实际， 
基本上都要通过数理 统计; 而数理统计的理论基础则完全建立在概 
率论之上. 

为了做到这点，当代统计学采用如下框架： 

设； C 〜 F ( x ,0), 其中 F { x ,6) 称为总体 X 的分布，0称为参 
数， F ( x ,6) 至少部分未知. 

…，是相互独立，相同分布的随机变量，同服从分 
布 F { x ,6\ 称为容鼉为 n 的简 单随机样本， 简称 样本. 

实际操作中观察到的是 n 个观察值 a : l 5 x 2 ,..., x n , 当代统计 
中把它们看作独立同分布的随机变量的观察值,这是使原本的统计 
学变成数理统计学的关键,只有这样才能对各种统计方法施行的效 
果进行概率的评价，从而使统计学成为科学，成为一般科学的方法 
论. 


这里采用独立同分布的假定事实上是数理统计建立初期的原 
型，便于建立系统的理论.它把历史上两大类统计问题统一起来, 
功劳很大. 

【概率 p 的估计】 统计学历史上的一大类问题是关于事件>1 
发生率 p = P ( A ) 的估计.从伯努利建立伯努利概型起，便涉及这 
类问题. 

从概率论角度看,已知 p 之后,要求研究4出现的频率，即在 n 
次独立重复试验中 A 出现 fc 次的概率,得到二项分布 ( 
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p + g = 1 ， fc = 0,1，2, • • • ， n . 对频率与概率关系的研究导致概率论 
两大定律，即大数定律和中心极限定理的发现. 

另一方面，若在 n 次独立重复试验中 A 共出现 fc 次，如何来估 
值 p 呢？从雅科布 • 伯努利到丹尼尔 • 伯努利，到贝叶斯，再到拉 
普拉斯都讨论过这个问题，而拉普拉斯更把该问题与法国人口的抽 
样调查结合在一起. 

至于英国的统计学先驱格朗特 （ J . Graunt , 1620—1674)，哈雷 
( Halley , 1656—1742) 和比利时的凯特勒 （ L . Quetelet ，1796 — 1874) 
也都是从人口统计学开始发展统计理论的. 

因此历史上人口统计（人口总数统计，新生婴儿性别比统计， 
寿命统计）的实际需要，推动对伯努利试验中概率 p 的估计的研 
究. 

【测置误差的估计】早期概率论大家如拉普拉斯,高斯等也都 
是天文学家，因此对天文和测地中观察误差的研究一直是他们关 
心的重要课题.这些研究使得拉普拉斯与高斯发现了正态分布.发 
现误差分布有规律存在最初是英国的辛普森 （ T . Simpson ，1710— 
1761) 于1755年在研究算术平均值时发现的.后来这个课题的研究 
—直持续不断.若 M 是真值， e 是误差，则义 i = ^+£ i , i = 1，2 ,…， n 
是 n 次独立观察，，〜服从相同的对称分布，它们可以是 
[- a , a ] 均匀分布、辛普森 t - a ， M 三角形分布、拉普拉斯分布或 
正态分布，任务是估计 M ， 并估计观察误差. 

这两个古典统计问题形式十分不同：从今天看，一个涉及离散 
型，一个涉及连 续型； 一个面对有限总体人口已有观察数据在手, 
一个面对无穷总体，可设计濟在无限次的观察. 

但是在上述框架下，它们被统一起来. 

在人口统计中，只要设 X 服从概率为 p 的伯努利分布，而 
A ， …，忍是它的 n 个独立观察，便可纳入模型，这相当于要求抽 
样是有放回的.对于人口总数很大，抽样量相对很小，这个假定至 
少是近似成立的. 
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当然随着统计理论和实践的进一步发展，抽样方法在社会生活 
中的应用领域日增，方式多样，对有限总体的抽样一般都是不放回 
的，而是要求每个个体有同等机会被选入样本.这种抽样方式保持 
了同分布的要求但不再具有独立性.一般把这种样本亦称为简单 
随机样本.对这种随机样本的研究形成统计学的一门分支，称为抽 
样调查，它已突破上述框架，但吸收该框架的大量研究成果，成为 
在社会生活中广泛使用的一种统计技术，在《概率论基础》第四 
章§2例10中略有涉及. 

二、数据的整理与压缩、统计量 

统计学是研究收集和分析数据的学问，一般更着重于分析数 
据方面.面对一个容量为 n 的样本，如何利用它研究总体的方方面 
面呢？第一步一定是整理数据.历史上，统计学中有一个学派对此 
作了系统的研究，这些大体构成如今描述性统计的内容.还有，随 
着计算机的发展，有了强大的计算能力，图形功能与交互式会话的 
能力，以数据分析为名的一些新方法也不断呈现，例如直方图，枝 
叶图，箱图，经验分布函数，曲线拟合技术等图形技术和各种汇总 
指标的计算.总的说，这些发展与概率论中对分布描述的发展是相 
互平行相互推动的. 

统计量概念的提出是最具重要性的，所谓 统计霣 是样本的函数 
f ( X u X 2 ，… , X n )， 它由样本完全确定，不含未知参数.提出统计 
量的目的是压缩数据即提炼信息，因为面对大的容量71，一大堆数 
据工1，2：2，〃.，〜显示不了什么，需要加以精炼，集中，变成少数几 
个量,这当中又希望不要丢掉有用的信息.历史上研究得最早最多 

的是关于样本算术平均值后来又研究中位数 X mcd 

i=l 

和样本方差 = i 最基本的可归纳为两大 类：一 
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类是矩统计量 A k = - j^Xl 一类是顺序统计量，包括极大值 X ；： 

^ i=l 

和极小值以及中位数，分位数等.然后利用它们再根据问题的 
需要构造出种种统计量. 

统计量是样本的函数，是随机变量，因此求它们的分布是最根 
本的事情.到此，我们就可以明白为什么基础概率论中要花那么大 
的力气来讨论求随机变量函数的分布.事实上，主要是为了适应统 
计学的需要. 

统计量的分布常称为抽样分布，因此统计学讲完基本概念后的 
第一章总是讲统计量的抽样分析.在《概率论基础》中讲统计三 
大分布 x 2 , F ， f 分布即为此.另外，讨论了极大值与极小值的联合 
分布以及极差的分布也为此. 

能求出精确分布的统计量是极少数，大量的只能求渐近分布， 
这也要依靠概率论，主要是利用中心极限定理，因此在统计学中正 
态分布仍是最重要的分布. 

为压缩数据而不丢掉有用信息提出的主要概念是“充分性”， 
这是联系总体分布与参数的一个重要性质，指数族分布（见习题三 
ni 题）的提出与此相关. 

三、三类统计推断问题 

统计学从部分推断整体，属于归纳推理.经长期发展,最后发 
展成三类问题，它们一起构成推断统计学的主要部分.推断统计学 
是与描述统计学平行的另一类统计方法与理论，一般认为它更代表 
近代统计学的真谛. 

第一类问题是估计理论，最基本的是未知参数0的估计.一方 
面提岀一些系统性的估计方法，主要有矩法，最大似然估计法和最 
小二乘法三种，在《概率论基础》都有 涉及; 另一方面是提出一些 
筛选标准及优良性准则，最重要的有无偏性，有效性和相合性三个， 
《概率论基础》也都讲到. 
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第二类问题是假设检验.这与利用试验资料建立科学模型有 
关.在统计学中发展成最主要的一类推断方法.这类方法密切联系 
于检验统计量的选取，而求检验量的分布更是重中之重，与概率论 
关系密切.《概率论基础》中在第二章§ 4 例 2 及（71， c ) 方案一例 
中作了简单的介绍，而第五章 §3 例 3 则指出大多数场合只能用渐 
近分布，因而中心极限定理起重要作用. 

第三类问题是置信区间，给出另一种形式的估计——区间估 
计. 《概率论基础》给出仅有的一例，见 （5丄35) 式. 

统计学在 19 世纪末到 20 世纪初由高尔顿 （ F . Galton , 1822 — 
1911)， 卡尔 • 皮尔逊 (Karl Pearson , 1857—1936) 主导， 20 世纪 20 
年代前后由费希尔 （ R . A . Fisher , 1890—1962) 大加发展， 20 世纪 
30 年代后期奈曼 - E . 皮尔逊创立假设检验新理论成为新的权威. 

瓦尔德 （ A . Wald , 1902 — 1950) 在 20 世纪 50 年代初曾以统计 
决策函数之名把这几类问题统一处理. 

四、正态总体下的统计理论 

当代统计学的典范是在总体服从正态分布 AT (/ x , a 2 ) 的情况下 
建立起来的.这个模型，一方面由于正态分布是实际问题中最常见 
的，有中心极限定理作理论依托，特别在测量误差这类古典问题中 
还有高斯正态性推导的有力 背景； 另一方面是由于在正态性假定 
下，许多精确分布能求得，这集中体现在下列费希尔引理 之中： 

费希尔引理若 X U X 2 , …、 X n 相互独立，均服从 N ( fi , a 2 ) } 
记 

i=l 


则 （1) 叉与纪相互独立， 
(2) 叉〜 
n 纪 


(3) 


X ； 


- 392 



这个定理是习题四〃 60 题，它给出X与纪的分布，它们又 
相互独立，因而(X, S 2 n ) 的联合分布容易写出.这种场合容易导出 
费希尔 F 统计量与哥塞特 (Gosset, 1876-1937) t 统计量的分布， 
从而能进行一系列统计推断活动.在这种特殊场合建立了近代统计 
学的漂亮而实用的理论. 

关于X 2 分布， F 分布与 t 分布的推导见《概率论基础》正 
文，亦见教学札记之二十六“统计学三大分布的推导”. 

这部分理论的建立完全依托概率论，概率论这部分的内容也因 
统计学的发展而充实. 

五、统计学概观 

正态总体场合利用正态分布的优良性质建立起来的优美统计 
理论成为特例,其他分布无法企及,稍微满意的是关于比例 p 的统 
计，它一般用频率^来估计，而知服从二项分布，这时三大统计 

推断问题能得到比较满意的解决，此外关于泊松总体， r 分布总体 
对均值的统计推断比较好办，对样本方差就难. 

因此在20世纪30年代就发展出一种新的方法，称为非参数 
统计，目的主要是去掉正态性假定代之以连续分布之类的假定，取 
得了一定的进展，形成非参数这一分支. 

另外一个分支是相关分析与回归分析，都与高尔顿关于生物统 
计的研究有关，特别是回归分析已发展成为统计学中最常用的方法 
之一.应当说，这部分的研究是统计学带动了概率论，包括带动多 
元正态分布理论的研究.《概率论基础》反映这部分内容的是第 
四章§2关于条件期望，最佳线性预测一小节. 

费希尔建立的试验设计与方差分析方法也成为统计学有广泛 
应用的分支之一，在20世纪中期，它们与回归分析等统一成线性 
模型，后期又发展成广义线性模型，这类模型由于有统计软件包的 
支持已很有实用价值. 

多元分析在20世纪二、三十年代由费希尔学派发展时只是一 
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些理论模型，如今在计算机软件支持下已成为很强有力的分析工 
具. 


计算机的发展在各个方面改变了统计学的面貌.总的说，20世 
纪后期统计学的发展主要体现在 计算统计上， 各种与计算有关的方 
法被提出，例如刀切法、自助法、交叉核实法、模型的选择与诊断、 
函数的拟合、 EM 算法、 MCMC 等，对稳健性也提出更高的要求， 
未来的发展也必与处理大数据集相关. 

去掉样本中的独立性假定就进入时 间序列分析， 其理论基础也 
从概率论进入随机过程，一般要引进平稳性假定，从而与平稳随机 
过程紧密相关.这类过程前有科尔莫戈罗夫的理论成果后有维纳的 
研究，近代已由统计学家改进成程式化的处理方法，获得广泛应用， 
如博克斯-詹金斯 （ Box - Jenkins ) 模型.另一发展方向是由控制论 
专家卡尔曼 ( Kalman ) 完成，用控制论中传统的运动方程和观测方 
程发展成多维递推模式,也得到成功应用.平稳过程中的谱分析理 
论在时间序列分析中也有相应发展，较多用于电信系统,也有用于 
经济分析. 

统计学向各应用领域的渗透形成新学科成为20世纪的一道风 
景线，由“生物+统计”而形成的新词（也即新学科） Biometrika 之 
后有 “ Econometrics ”, “ Technometrics ” …， 这类词已达数十个. 


教学札记之二十六 I 


统计学三大分布的推导 

统计学三大分布， X 2 分布， F 分布， t 分布，由于它们的重要 
性，已提出诸多推导方法.这些是基础概率论中求随机变量函数的 
分布方法之范例，特举要介绍. 

一、 X 2 分布 

若々，…， Z n 相互独立，均服从标准正态分布记 
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Xl = ^ + + 定义； ^ 的分布为 X 2 分布，其概率密度函 

数表达式为 i n x 

p ( x ) = n f ， ^ > 0 (1) 

2 r G) 

其中 n 称为自由度或参数.通常这个分布也记作；^或 x 2 ( n )， 并 
不会造成混淆. 

X 2 分布于1900年由卡尔 • 皮尔逊再引进，是统计学中最重要 
的分布.后发现它可以归人 r 分布，为 r (^ 5 i ). 

求（也是“记忆”） X 〗分布的数学期望和方差的最好方式是记 
住如下 推导： 

显然 . 

EZi - 0, DZi = EZf = 1, DZf = EZf - { EZf ) 2 =3-1 = 2 
故 

^Xn ^ + • • • + = 71 

^Xn = DZf + … + DZ ^ = 2 n 

由习题五 *37 题及习题五 *58 题知，渐近 iV ( o , 1), 即以以 

v2n 

正态分布为渐近分布. 

X 2 分布的推导方法很多，以下是最典型的. 

1. 从定义 d =苟+…+ 0出发，用 n 重积分直接计算，化 
为 n 维球坐标，最后导出表 达式. 请参看习题三 *37 题及其解答， 

2. 直接计算 X ?的表达式，再用 X 2 分布的可加性,用归纳法导 
出. 

《概率论基础》在第三章§3导出 x ? 的表达式（3.3.10)，并在 
例7证明了 x 2 分布的可加性，指明了这种推导法. 

3. 借助 x 2 分布与 r 分布的关系，由 g 分布为 rQ , i ) 立即 
得出. 

4. 用特征函数法 . xg 的特征函数 （1-2 it ) -？与密度函数 （1) 
对应，这里隐藏着许多推导法. 
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二、 X 分布 

利用这个机会，我们来推导 Xn = v 2= y/zl + 7 - - + zl 的 
分布密度函数，由于它在 n 维欧几里得空间中表示（&，••• ， Z n ) 与 
原点的距离，因此这个分布在自然科学中有许多应用. 

显然，对 x 彡0， 

F Xn { x ) = P{Xn < x } =0 


而对 x > 0, 


F X n i x ) = p {Xn <x}^ P{xl < X 2 } 


n 


0 


f - 1 -2 H 

y e dy 


Pxn( x ) = O ) = 


1 (^ e -. 2 . 


1 


.A 


⑵ 




x > 0 - 


21 一 1 r © 

注意当 n = 2 时 ， p = y/Zj + Z ^ 的分布即为瑞利分布 (3.3.41), 

r 2 

R ( r ) = r e 2 ， r > 0 


当 n = 3 时 , S = ayJZl + Zl ^ Zl 的分布即为麦克斯韦分布律, 




^ ~ 2 ^ 


P (和心 ，， 5>0 


见习题三36题. 


p ^ {y) = 



e 




这在后面用到. 


y >0 
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三、 F 分布 


no ⑽与"虫立，则称^勞 
分布，其密度函数为 


服从 F 




p ( x ) 


f f-1 




m+n ， 
2 


> 0 


⑷ 


其中参数 m ， n 分别称为分子自由度与分母自由度，这分布记作 

F ( m , n ). 显然 ^ 〜 F ( n , m ). 
r 

在处理； d 变量时通常都除以它的自由度，大体可理解为关心 
的是每个自由度的变差贡献率，这样来定义统计量 F 最早由美国 
统计学家斯内德克 ( Snedecor ) 引进. 

费希尔引进了 F 分布的一种变形，二者事实上是等价的，目前 
用的较多的形式是 F 分布.这个分布取名 F , 正是为了表彰费希 
尔的贡献. 


F 分布的推导相对比较单纯，主要有下列 二法: 


1. 用变换法.作变换 S = X + Y , F = 利用 x 2 分布的 

Y/n 

可加性立得 S 〜 Xm + n - 这时用『分布的刻画性质知 S 与 F 独立， 
因此很容易得到 F 的密度表达式，在《概率论基础》第三章§ 3例 
7中就是这样做的. 


2. 用除法公式. 

r+oo 

Pf ( z ) = { zv )pA v ) dv 

J—oo m ♦» 


广 +oo 

Jo 


m 






dv 
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m n 


+oo 守 — i 一 


m:+n 


2 




V 2 




Z 


V 


e 


dv 


T 1 


m 


r 


(?) r © (“» 


• v 221 m , 

m+n 
2 


Z ^ 0 


四、 * 分布 

t 分布一般采用便于统计学中应用的形式定义. 


X 


Vy/n 


设 X 〜 AT (0, 1)， Y 〜 xl 且 X 与 Y 相互独立，则 r 
<( n ) 分布，其密度函数的表达式为 


p (： r ) = 



— OO < X < +oo 


(5) 


参数 n 亦称为自由度. 

t 分布关于 x = 0 对称，属于肥尾分布，因此只存在 r < n 阶 
矩.特别当 n = 1时它化为柯西分布，连数学期望都不存在. 

t 分布于1908年由英国统计学家哥塞特在以 “ Student ” 为笔 
名的一篇论文中引进，开创了小样本理论这一分支，是统计学中三 
大分布之一，自由度一词也是哥塞特最早使用的. 

t ( n ) 以正态分布为极限，事实上当 n 较大时，二者已很接近. 
t 分布的推导法也很多，下面列举其中重要的几种： 

1. 用变换法.例如在《概率论基础》第三章§3例8中通过 
引进增补变量 5 = y , 建立 （ HO 与 （ ST ) 的——变换，从而得 
到 ( S , T ) 的联合密度函数，再通过求边际密度得到 T 的密度函数 
(5). 

2. 用除法公式，即《概率论基础》（3. 3 .!23).利用 X 与 y 的 
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独立性， X 〜 iV ( 0 , 1 ) 而 y / YJ ^ l 的密度由 （ 3 ) 表出，故 

r-hoo 

PrW = HPx^P^yj^iv) dv 



3 . 化为极坐标.作变换 

x = r cos 0 , y/y = rsin ^, (r > 0 , 0 < 0 < jr ) 



dx 

dx 




dr 

dd 


cos 0 

一 r sin 0 

dy 

dr 

dy 

ae 


2 rsin 2 0 

2 r 2 sin 9 cos 6 


= 2 r 2 sin 0 


则 


\/2jt 


e 


4 1 S-i R 


,2 


r ( f ) 

1 


2 一 2 

y e dxdy 


rl 


O 2 

这时 r •与 0 已分离，再作变换 


—- T - r n sin n ~* 1 0 e 2 drdO 

71 — 1 


X 


vy/ri 


y / ncot 0 



晒有 dt= -》 


sin 2 0 


1 


1 + cot 2 0 
注意变换行列式应为正， （*) 化为 


n 


r - e" T 




， *2、 n±l 

1 + -) 2 
n / 


dtdr 


(**) 


对 r 求积得到 f ( n ) 的密度表达式 （5). 

4 .利用 F 分布 导出. 注意到; T 2 = g ， 后者显然服从 F ( l , n ), 

这提供了从 F 分布导出 f 分布的一条途径. 

显然 T 是对称的，因此 

G ( x ) = P { 0 < T < x } = \ p { T 2 < x 2 } 



G \ x )= 


喻 g )« 2 ) 乎 


X 


这正是 （5). 




n+l 

2 
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教学札记之二 


[0,1] 中数的 g 进制展开与概率论 

在早期概率论的研究中，发现有两个问题不能在离散样本空 
间中严格表述.一个是几何概率中所称的从 [0,1] 区间中随机选 
一个点，另一个是可列重伯努利试验 E ' 其中样本空间都不可列. 
例如庞加莱 （ J . Poincare , 1854 — 1912) 就在1896年出版的《概率 
演算》中提到在 [0,1] 中随机选一点为有理数的概率.后来博雷 
尔 (1871-1956) 在数学研究中涉及这两个问题，发现它们是同一 
个问题，于 1909年发表了 “Les probabilites denombrables et leurs 
applications arithmetiques 57 . 

在该文中，博雷尔证明了 [0, 1] 中正规数 ( 即在该数的无尽 

十进制展开式中，0，1，2，*-，9出现的频率均为的度量为1, 

这就是有名的强大数定律.博雷尔的工作是第一次提出了以概率1 
收敛性 • 

博雷尔的研究揭示了概率论与测度论的内在的深刻联系，极大 
地推动了科尔莫戈罗夫在博雷尔所创的测度论和他的学生勒贝格 
所创的测度-积分论的基础上建立起概率论的公理化体系. 

一、二进制展开与博雷尔正规数定理 
[0,1] 中的任一个数 a ; 可以用二进制展开成 

k 二 1 

其中 咖) 为0或1_ 

有限小数如 0.1 有 0.1000 … 和 0.0111 …两种无尽小数表 
示，为使表示法唯一，以后一律约定用后者，余类推.因此[0，1]中 
的任一个数0；与无限序列 ㈣ ，…）建立了一一对 
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应，而后者可以表示一串掷硬币的可列重伯努利试验. 

[0,1] 原有的测度是长度，对任何0 < (Z < 6 < 1定义 [ a ， 6 ] 的 
长度为& - A 记作 


P{[a，&)} = 6-a (2) 

~ "般 地，对0 < Cli < bi < a 2 < &2 < • • • < < 1，记 

A = 则 

i=l 


n 

P { A } = _ A ) (3) 

i=l 

这个定义可以推广到（严格说要用到测度扩张定理）所有博雷 
尔点集，甚至勒贝格 点集為 仍记为 P ( A ). 

若记 I ? = [0,1]，记[0, 1] 中一切博雷尔点集为多，贝 I 〗 （ A 多，尸) 
构成一个概率空间.这个概率空间事实上在《概率论基础》的定 
理 3.3.1 的证明中，例 5.3.4 及例 5.4.1 中已出现过.由习题三10题 
知若是定义 r /( a ;) = a ;， 则 F ( x ) = P{v(^) < x } = x 为 [0,1] 上均 
匀分布，它给几何概率以严格的概率意义. 

在展开式 （1) 中 

•P{6( 山 )= 0} = p|cj € (o, J = ^ 

尸 {6( w ) = 1} = = • ⑷ 

类似地，若〜处，…， a n 为任何一个 0-1 序列，使 a ; 满足 



则 


{a; : ^i(a;) = oti，i = 1 ， 2,… 



ai + F 
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从而 

P{u; : ^i(u) = a,, i = 1,2,,n } = — (5) 

特别地，尸{&(0；) = ai ) = i = 1，2, …， n ， 故有 

n 

P{^ ' (,i{u) = ai, i = l ， 2, •… ,n} = JJP{a; : ^i(a;) = ai} (6) 

t=l 

这表明 ,^ n ( a ；) ••-相互独立，各以概率 i 取 

值0或1，可以看作掷一枚均匀硬币所对应的伯努利试验序列五~ 
(从有限到无限严格说要用到科尔莫戈罗夫相容性定理). 

这样一来， [0,1] 均匀分布与 p = ^的五°°被统一处理. 

这时从《概率论基础》第二章知 

: = fc } =(:) ( 壶 ），fc = 0， l ，2，…， n ⑺ 

i=l \ 〆 

从第五章 (5.1.14) 又知成立伯努利大数定律. 

定理1 

nt P { H ^ 亡咖) -臺卜} =0 ⑻ 

i=l 

从第五章 （5.4.19) 知成立博雷尔强大数定律 

定理2 

ts=l 

这就是博雷尔当年证得的正规数定理，也即 p = I 的定理 

5.4.2. 它表明在 [0,1] 中的数的二进制展开式中0, 1出现各半的 
数（正规数）的测度为 1. 因为有限小数，有理数全体都不是正规 
数，其测度为0,这也回答了庞加莱的问题. 

这是算术性的定理，也是概率性的定理,从现代角度看还是测 
度论性的定理.这样一来，博雷尔大大突破了早期概率论的研究范 
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围，为概率论的发展开拓了新境界. 

由于 l¥l ^ b ^ b <oc ' 用魏尔斯特拉斯比较判别法 
* ‘ 1=1 

知对每一个 o ； e f _收敛,故有 

i=l 

定理3 

尸{土亡響〜} = 1 ( 10 ) 

t=l 

再由习题五34题可得 

定理4 

lim p( < x j = x, 0 < x < 1 (11) 

n—*00 L ^ A x ) 

i=l 

即 11 的分布收敛于 u [ oM 其证明见习题解答，用特征函数 

t=i 2 

作工具，关键是利用了下列韦达三角恒等式 

sint ^ t , 

丁 = II cos 开 （ 12 ) 

fc=i 

二、康托尔集与奇异函数 

康托尔集的构造 如下； 从区间 [0,1] 中刨去三等分的中间开 
区间(*，誉)，剩下的是两个闭区间[ 0 4]与[^ 1 ]之并，记之为 

Gi ，为闭集.接着，对各闭区间三等分，刨去中间的开区间(^，^) 

及(昼+去 j +吾)，剩下的是 4 个互不相交的闭区间之并，记之 

为 G 2 , 也为闭集，如图 5- 3所示. 

如此进行下去，可以得到单调下降的闭集序列 { G n }. 记 G = 

0 ，则 G 是非空的闭集.这个集 称为康托尔集 .从 [0,1] 刨去 
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9 9 3 3 9 9 



图 5-3 

的集合 G 是可列个开区间之并，是一维博雷尔点集，从而康托尔集 
G 也是一维博雷尔点集. 

上述操作中，第 n 阶段刨去2- 1 个开区间，每个长度为_， 
刨去的总长度为 

°° fyn—l 

eV =i ⑽ 

n=l 

因此康托尔集 G 的测度（长度）为 0. 

对 [0,1】 中的实数用三进制展开，按康托尔集 G 的构成法 ，第 
一阶段刨去开区间 （0.1，0.2)， 第二阶段刨去开区间 (0.01, 0.02) 及 
(0.21, 0.22)," •，第 n 阶段刨去的是形如 

(0 • d\a2 • * * d n — 1 lj 0 . 1 2) 


的开区间，其中叫取 0 或 2 的值全体.因 G 中的点包含刨去的区 
间的端点，这些端点在三进制表示中有两种表示法.若约定 


0 • Q\d2 ' * * ^n— 1 1=0. CL1CL2 * * * An— 1 022 •• • 


则这些端点也有唯一的表示法. 

这样一来， G 中的数是叫取0或2的三进制小数 


0 • Q1Q2CL3 * * * 
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反之，能这样表示的实数也属于 G . 

不要以为 G 中的数是一些孤立的点，事实上 



其中 


bk 


a 允 

T 



ajt = 0 
dfc ■― 2 



(15) 


(14 ) 建立了 G 中的数与 [0,1] 中数的一一对应，因此 G 的势 
也是连续统，而非可列点集. 

在康托尔集 G 上定义函数 F ( x ): 

F (0. aia 2 •••) = 0 .& i &2 • • • (16) 

这里 F { x ) 之值以二进制表示.这样一来， 

■F*(0. a\(i2 • • * a n — 1 1) = F{0 . aid2 • ■ • dn—i 022 • • •) 

= 0 .6162 • • • b n _i Oil • • • 

= 0 • 6162 * * * 1 

= F (0 . d \( i 2 • ■ • a n —1 2) (17) 

即 F ( x ) 在刨去的区间的端点的值是相等的.若以端点之值来定义 
F { x ) 在这个刨去的区间中的函数值，则这样定义的函数 F ( x ) 是 
区间[0，1]上单调增加的连续函数，称为康托尔 函数， 参见上文的 
图 5-3. 

进一步，若补充定义 


F ( x ) = { 



x ^ 0 
x > 1 


则 F ( x ) 为分布函数. 

由于在 G 上， F \ x ) = 0,因此 F { x ) 只在康托尔集 G 上增加， 
而康托尔集 G 的测度为0,因此这样定义的分布函数 F ( x ) 是奇异 
函数. 
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在函数论中奇异函数是相当罕见的，所以在函数论或测度论 
中要举奇异函数的例子，几乎没有例外地都以康托尔函数为例.但 
在概率论中两个测度（或两个分布）相互奇异是家常便饭，不过已 
超岀我们讨论的范围. 


三、二个奇异分布的卷积 

两个分布函数的卷积对应于两个独立随机变量之和.人们不禁 
要问：两个奇异型独立随机变量之和属于何型？ 

当然可以是奇异型的，例如康托尔函数的卷积仍为奇异函数. 
出人意料的是居然也可以是连续型.下面略作介绍. 

类似上段讨论，可以构造其他进制的康托尔分布.例如 



是一个随机变量，它对应于把 [0,1] 中的数作4进制展开 ，其； ^ 
只包含0或3而无1或2的.相当于通过把区间 [0,1] 四等分，然 
后再刨去中间二段,依次不断进行得到的康托尔集. 


另外，不难验证 




的特征函数为 cost , 而丨-1，1]的 


特征函数为 


sin < 


• 若琺 ， fc = l ，2，." 相互独立，均服从 




则 〜 丄， 1 ]. 

注意这 s 用对•称分布 I j 以使特 

征函数为实值，便于处理，事实上这里用的是伯努利试验的另一 
种表达法，在随机游动中曾用过.这里的取= 2心 - 1，又称为 
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Rademacher 随机变量.两种表达法的等价性是明显的. 


7K. 


因此韦达公式手二行哪丟是 f /= 史龚 

k=\ k=l 


的特征函数表 


显然 



(19) 


def 


U = 2 V l + V 2 



右边两个无穷乘积分别表示两个奇异型随机变量的特征函数，这 
两个独立随机变量之和是连续型的，因为左边表示 C / hl , l ] 的特 
征函数. ^ 

同样地 

OO^OC t oo 免 

= ri cos ( 3 *9fc)ri cos 9fc ( 2i) 

fc—■ 1 /c = l /c-— 1 


y ^ 3 ^! + W 2 

若以 c，A S 分别记连续型，离散型，奇异型，则独立随机变 
量 x 与 y 之和的型 如下： 



c 

D 

s 





c 

c 

C 

c 

D 

c 

D 

s 

s 

c 

S 

c 或 s 


学 4 L 记之二^十 〆 、篇 


切比雪夫不等式与大数定律的证明 


1866年切比雪夫发表了论文“论平均值”.这是一篇开创性的 
论文.从现代的观点来看，这篇论文证明了一个不等式——切比雪 
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夫不 等式; 用这个不等式证明了一条大数定律——切比雪夫大数定 
律，它只要求方差有界,把伯努利大数定律和泊松大数定律都作为 
一个很普通的特例.同样重要的是这篇论文使用随机变量的概念: 
把数字特征作为工具，是“矩法”的开山之作.从此，随机变量成了 
表述概率问题的主要工具,古典型的框框被彻底突破，概率论的发 
展中心也从西欧转移到东欧的圣彼得堡. 

新方法展现出巨大的威力，1887年切比雪夫又开创了方差有 
界场合一般中心极限定理的研究，虽然结果不够完善，但指明了方 
向.下一步由他的两位杰出的学生来完成：马尔可夫 (1856 — 1922) 
拓展矩法，研究了相依变量的极限定理，开创了马尔可夫过程这一 
崭新 领域； 而李雅普诺夫 (1857-1918) 则引进特征函数这一有力 
工具，证得了李雅普诺夫中心极限定理，为古典极限定理的最终解 
决奠下基石.他们的继承者辛钦和科尔莫戈罗夫在近代极限定理的 
研究中更是名垂青史. 

一、切比雪夫不等式 

1866年切比雪夫建立了不等式 

( 1 ) 

他首先就把它用来研究大数定律.为节省篇幅，本文一律沿用《概 
率论基础》第五章的符号，不再一一说明. 

当时已知的大数定律，一个是众口称誉的建立于150多年前 

的伯努利大数定律： 


lim 





另一个是不久前才提出，当时很少有人相信的泊松大数 定律: 

lim 卜一仍土仍 + ••• + 〜 < 1 =1 
n—►oo 11 71 Tl J 



这两个大数定律都是使用复杂的分析方法证明的，若使用切 
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比雪夫不等式，它们的证明只要一行 文字: 


pfl/fn __ Pl+P2 + ".+Pn 

ll n n 


D (^) ^ D ^ n ) 
e 2 n 2 e 2 


n 


^Pkqk 




n 2 e 2 、 4ns 2 

切比雪夫注意到加项 0-1 分布的假设并非必要，独立性也可 
放宽，于是建立自己的大数 定律： 

若 {Cfci 灸 = 1， 2, … } 两两不相关，且 ( C , fc = 1， 2, …， 
则 


lim 




⑷ 


按现代的记号，证明也只要一 行: 


1 n 1 n 




各一。 


(5) 


随机变量的表示、切比雪夫不等式、矩法等新方法显示出无穷的威 
力 • 

首创者过于着眼要解决的具体问题，后继者更关心新方法的适 
用范围.马尔可夫详细地审视了老师的证明，发现⑷式的成立，不 
相关和方差一致有界的假定并非必要，只要在 （5) 中直接要求 

fc=i 


即可.这就是著名的马尔可夫条件，是大数定律成立的一个最常用 
的充分条件，从而建立了自己的大数定律即马尔可夫大数定律. 

舍去独立性，舍去方差的一致有界性，从而使大数定律的应用 
范围大为推广.过渡到非独立场合特别有意义，因近代（例如随机 
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过程论中）要研究有某种相依性的随机变量序列的极限定理，马尔 
可夫在此领域成了首创者. 


二、马尔可夫不等式 

马尔可夫在这个过程中还创立了自己的不等式，即马尔可夫 

不等式 

r > Q ⑺ 

此即《概率论基础》中的（5.2.22)，课文中的证明过程故意采 
用与切比雪夫不等式的证明过程表面相反但实质一致的顺序，_ 
者细察. 

当 r = 2即化为切比雪夫不等式.但适当的 r 在某些场合是 
必要的. 

下面介绍三个应用方面的例子. 

1. 当把2阶矩推广到 r(r >0) 阶矩，马尔可夫不等式一锤定 
音地证明了定理 5.2.8 g 卩 r 阶收敛推出依概率收敛.事实上 

^{l^n^ n £r ~^ |r — o (8) 

2. 在博雷尔强大数定律证明中的应用. 

为证明定理 5.4.2 (博雷尔强大数定律） 

p { 守一 p } = 1 ⑼ 

必须证明 

£ p {|^r -p \> £ } <00 ⑽ 

n=l 

这时若利用切比雪夫不等式，只能证得 

p {| 守-和 H 占 (11) 

这不足以保证 （10) 成立，必须有更好的估计方法，这时利用 r = 4 
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的马尔可夫不等式就能证得 

p {\^~ p \ >£ } ^ h E \^~ p \ 4 (12) 

从而保证了 （10) 式的成立，并证得定理. 

3. 习题五46题要求读者把博雷尔强大数定律推广到独立同 
分布有有限4阶矩的场合，证法类似. 

事实上，作更细致的考察与计算，能推广到独立而非同分布但 
4阶矩有限的场合，即著名的康特立强大数定律，详细叙述如下 •. 

康特立强大数 定律: 设&，&，… ，^… 是独立随机变量序列， 
E \^- 邱| 4 < C ， 其中 C 为某个常数 ， i = 1，2,…，则 

=0 } = 1 ( 13 ) 

1 


证明为书写方便,不失一般性，设= 0 ， i = 1，2, . • •，记 
SVi = + …+ 6i， 

^ = ( Cl +--.+^ n ) 4 


故 


i<j<k<l 的 • 




ESi = ^ 於 + 6 E 雖巧 

t=l i<j 

^nC + 6j2y/ E ^ E ^ ( 14) 

*<j 

“C + C < 3 n 2 C 

£i 
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因此 

f >( 令)、3忠 〈〜 ⑽ 

n=l n=l 

由马尔可夫不等式 

立即得到 

n=l n=l 

由博雷尔-康特立引理知 


这个证明中，用切比雪夫不等式只能处理2阶矩是不够的,用马尔 
可夫不等式估计4阶矩正好.这个定理包含博雷尔强大数定律为 
特例. 

但在更一般的场合，为证明强大数定律成立，须证明 

j 

lim P { sup - 從） ^4=0 (17) 

m—oo ^ J 

这时马尔可夫不等式就无能为力了.这个难关由他们的后辈科尔 
莫戈罗夫突破. 

三、科尔莫戈罗夫不等式 

科尔莫戈罗夫不等式 设，^是独立随机变量，方差 
有限，则对任意£〉0成立 

p { -從 )1 ^ £ }^~ 2 E d ^ ⑽ 

i=i j=i 

当 71 = 1时得到切比雪夫不等式，所以它是切比雪夫不等式 
往另一方向的推广. 
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科尔莫戈罗夫不等式对随机变量部分和的最大值作概率估计， 
含意深刻，证明难度大，用途也广，在强大数定律的证明中起主要 
作用 • 关于科尔莫戈罗夫不等式已有许许多多的推广，每出现一种 
随机过程差不多都要推导相应的不等式. 

总之，从切比雪夫不等式开始的不等式林林总总不下数十种， 
要写一本关于这类概率不等式的书一定相当厚. 

值得指出，切比雪夫类型不等式在概率论中的应用并不局限于 
大数定律.另外关于科尔莫戈罗夫不等式在强大数定律中的应用这 
里也不展开了，部分内容已写入教学札记之二十九“强大数定律证 
明途径评述”. 

这段历史的回顾让人印象深刻的是学派的创立，研究课题和 
方法的延续和创新. 

四、一点注记 
切比雪夫不等式可写成 

对每个 S >0 成立. 

由于 J < 1肯定成立，因此只要考虑5 > 1的情况. 

能构造一个使等号成立的随机变量，例如 



— t 0 t 

P 

1 1 1 1 

2 t 2 t 2 2 t 2 


找= 0， 以=1， = ^ 

在这个意义下切比雪夫不等式已是最好的估计，无法再改进. 
但这个随机变量概率分布随《而变，因此对于一个给定的随机变量 
它并不一定是最好的.进一步，若已知分布，则 （19) 式左端的概率 
不需要任何估计.以正态分布为例说明之，这时用切比雪夫不等式 
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估计的效果欠佳. 


6 

1 

2 

3 

4 

所有分布 

1.00 

0.25 

0.11 

0.06 

正态分布 

0.313 3 

0.045 5 

0.002 7 

0.000 06 


概率论历史研究表明，切比雪夫不等式和矩法先为法国数学 
家比埃奈梅 ( Bienayme , 1796 — 1878) 发现.事实上，切比雪夫本人 
也把发明权归给他. 

教学札记之二十九幢 


强大数定律证明途径评述 

对于独立同分布场合，科尔莫戈罗夫证得数学期望的存在是强 
大数定律成立的充分必要条件，见《概率论基础》定理 5 A 4 •这 
是一个最终的结果. 

但对于一般独立随机变量序列则得不到如此漂亮的结果，因此 
只好找一个优异而又易于验证的充分条件.目前最好的结果也属于 
科尔莫戈罗夫，这便是通常所讲的科尔莫戈罗夫强大数定律.我们 
下面要评述的便是这个强大数定律的证明途径，因为它有极大创 
意而且充满技巧性.在《概率论基础》中它与最后一节的林德伯 
格-费勒中心极限定理的证明技巧是概率论中的证明方法的典范. 
况且上述定理 5.4.4 也是利用这个定理加“截尾法”证明的. 

科尔莫戈罗夫强大数定律设 i = 是独立随机 
变量序列，若 



则成立 

P{ lim - 工 >- 五 00} = 1 (2) 

l n —71 ) 
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对于 （2) 这种以概率1收敛性，课文 （5.4.16) 已指明相当于要求证 
明 

p { 恭(这心-恥 I )々} = 0 ⑶ 

i=l 

为了用矩来表达上述收敛条件，必须用“矩法”建立起切比雪 
夫型不等式.但这里遇到的是事件 f ☆-邱^的 

i=i 

k 

并 U 因此切比雪夫不等式是不够用的，这时科尔莫戈罗夫建 

n~l 

立了新型不等式，现在已通称科尔莫戈罗夫不等式，是切比雪夫型 
不等式的重大发展. 

科尔莫戈罗夫不等式 设心， &，•••，&是独立随机变量，方差 
有限，则对任意6〉0,成立 

p { | -阳 I ⑷ 

i==l j=l 

当 n = 1时就得到切比雪夫不等式. 

但是科尔莫戈罗夫不等式比切比雪夫不等式强很多.以这里 
讨论的$，&，•••，&相互独立场合为例.切比雪夫不等式给出： 

n - n 

p {| E ⑷ -拖 )卜分 < p E % ( 5 ) 


而科尔莫戈罗夫不等式则对更大的集合0 

i=l 、 i=l 

的概率给出同样的上界. 

科尔莫戈罗夫不等式证明的关键在于把如下的复杂事件 
{ max I y2(^i - E^i) > 4 用“首次进人（即 > e ) 分解法”（参看 

1 lWn 1 tl J 

习题一 4题）表示成不相容事件之和，再利用随机变量的独立性使 
用马尔可夫不等式过渡到“矩”而得到. 
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科尔莫戈罗夫不等式已被推广到各种场合，出现许多变形. 

总的说，要证明强大数定律离不开科尔莫戈罗夫型不等式，再 
配合上 （3) 这类收敛性条件（博雷尔-康特立引理是作用相当的另 
一种形式)，还使用一点别的技巧就能达到目的. 

目前常见的证法大体有三种，简介如下： 

1. 普通方式（见于大多数教科书） 

证明 要点： 由科尔莫戈罗夫不等 式知： 对任意 a >0, 

i=l i=l 


因此 


r 

P{ max 

I ^ 


— E^i 







⑺ 


故 






因 ¥ < °°，令 a — 得 


t=l 


piT 


ii - 


l ^ i 


< oo 


}= 


这时用一条数学分析中有名的 Kronecker 引理: 

Ck 

c oo, m — 

. n f 

k=l k: 


若言^ <0 °，则 0 , 


即得 


^ E (^ - 上^ 0 


< a 


⑻ 


⑼ 


( 10 ) 
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利用科尔莫戈罗夫不等式证明条件 （1) 可保证 i 以 

i=l 

概率1收敛，再用 Kronecker 引理推知丄 Y"(Ci - E ^ i ) 0,是 

这种方法的主要证明思路. 

2. 用推广的博雷尔-康特立引理 
对 { A n } 找一个整数序列1 = m < n 2 < …，注意到 

oo n i+ 广 1 cx> n «；+i — 1 oo 

E P { U E P ( A n ) = ^ P ( A n ) 

j=l n=rij j=l n=rij n=l 

OO 1 一 1 oo 

可看出 y ^ p | [J -4 n j < oo 比 E P ( A n ) < oo 稍弱. 

j=l n=njf n=l 

oo n i+i 一 1 

推广的博雷尔-康特立引 理：若 1；/^ IJ 乂 n} < OO, 则 

j=l n=rij 

P { Um A n } = 0 (证明略). 

L n—oo J 

利用科尔莫戈罗夫不等式得 

k=l 

E ^ 

j<2 爪 +1 

而 

52 P m ^ e 222 m ^ 1 / D$j 

m=l m=l j<2 m + 1 

i=i 

这里 V 对 P + 1 > j •的 m 值 求和. 

^tn 
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以不等式 2 P ^ < 2 P + 1 来定 p ， 于是 

2~ 2m = 2 _2m = - - 2 _2p < — 

乙 rn 乙 3 3 j 2 

m—p 。 

因此当时， 

㈣ 3 f>“iE 学 <+00 (!3) 

m=l j=l J 

用推广的博雷尔-康特立引理知 

^ E (6- 取 k ) 彡 e (14) 

ft , 

A:=l 

发生无限次的概率为0,即以概率1成立 

^ y^(Cfe - E ^ k ) ―> 0 

71 k=l 

从而证得强大数定律. 

这种证法初见于格涅坚科《概率论教程》，后为国内一些教材 
所采用 • 

3. 通过推广科尔莫戈罗夫不等式 

《概率论基础》所采用的证法就属于这一类.这时先把科尔 
莫戈罗夫不等式推广为噶依克_瑞尼不等式 


j 1 m n 

心 | E (卜蜂七如 E 4+ E 制) 

i=l j=l j=m+l 


为证明这个不等式可先把事件 f max Cjly ^^ E ^) 用 

^ 彡 n l ^ J 

“首次进入分解法”表示成不相容事件之和，再巧用随机变量的独 
立性，利用马尔可夫不等式过渡到“矩”而得到（见课文). 

当 m = 1 ， Cj = 1即为科尔莫戈罗夫不等式. 
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取 G \ 利用这个不等式比较快就证得科尔莫戈罗夫强大 
3 

数定律. 

《概率论基础》编写时从 Rao 和 Rohatgi 的书中取来这种比 
较新颖的证法，而把另外两种证法改编成五道加双星号的习题.这 
次出第三版，因考虑这些题目难度过高，已经删去. 

科尔莫戈罗夫强大数定律还有其他证法，而且可预计还会有 
新的证法不断推出.希望这个评述能帮助读者对这个定理的证明 
加深理解. 


教学札记之三十 I 

关于进一步学习的建议 

学过《概率论基础》之后，许多读者会有进一步学习的要求， 
或许希望听取一些建议.因此在这里谈些个人的看法.但本文受笔 
者的学识所限，所提建议未必正确，谨供参考. 

我想应把读者区分为两类.一类是准备以概率、统计为专业或 
从事与概率、统计关系极其密切的专业的 读者; 另一类是准备以概 
率、统计为工具从事自己专业工作的. 

对第二类读者，我认为如果他们已掌握了《概率论基础》的 
基本内容，那么在概率论知识方面基本上是够用的.为开展在本学 
科的研究，应该学习数理统计，向应用方面发展.这方面内容很多， 
够学很长一段时间.如果碰到有概率论方面的知识不足，那时再回 
头来补习，时犹未晚，也更有针对性， 

在学完数理统计的公共部分之后，还要按照专业方向学习一 
些专题即数理统计的某些分支.大体讲，对从事经济管理研究的, 
回归分析和时间序列分析最为重要.对从事社会学研究的，则抽样 
调查和相关性指标（属非参数统计）比较有用.对从事工业技术的 
可关心质量管理.对学医学的涉及统计知识很多，例如应多关心列 
联表、广义线性模型和生存分析，有些场合，多元分析是有力工具. 
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总的说对这类读者，透彻理解统计学思想，掌握某些分支的知 
识，熟练掌握一两种软件系统就可以在本专业做出好的成绩. 

对于第一类读者，应当学习测度论，照我的看法也应当学习数 
理统计，完全不懂统计,很难真正理解概率论，少数人除外. 

这里所讲的测度论，事实上是指测度论与概率论结合起来讲 
的以测度论为基础的高等概率论，名字不少就叫“高等概率论”或 
“现代概率论”（事实上目前学测度论的人绝大部分是学概率统计 
的学生).这种书国内出版的至少有十本，国外好的至少也有十本， 
可选择一本学习. 

学完测度论的髙等概率论之后就可以进入到概率论的各个领 
域，主要是随机过程、随机分析、极限定理和各应用分支. 

学习数理统计，绝大部分书籍并不假定要懂测度论，但进人数 
理统计比较理论或高深的部分还是非要测度论知识不可.邵军 (Jun 
Shao ) 的新作 “Mathematical Statistics ” ( Springer ), 可为首选. 

顺便提及，若要进人蒙特卡罗，刘军 （Jun S . Liu ) 的书 “Monte 
Carlo Strategies in Scientific Computing ” 可为首选. 

学习极限定理，古典的还是要读格涅坚科和科尔莫戈罗夫的 
书，有中译本，但钟开莱的英译本加了很好的注释可参考.比较现 
代的内容可看佩特罗夫的专著，也有中译本《独立随机变量之和 
的极限定理》. 

随机过程的入门书， Ross 的书 “Stochastic Processes ” 有特色， 
其次是 Karlin & Taylor 的几本书. 

随机过程的主体是马尔可夫过程，从离散时间马尔可夫链开 
始到连续时间马尔可夫链，钟开莱的书是经典，要进人排队论也应 
从这里开始. 

连续时间马尔可夫过程， Doob 的书是经典， Feller 第二卷也有 
不少内容.但还是选一本较新的人手，例如陈木法的书. 

近年来随机分析受到最大重视，书出得最多，鞅、布朗运动、随 
机积分、随机微分方程都列入此类.想进入数理金融学的要有相当 
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的随机分析的基础，不过这几年已出了近十本直接把数理金融学 
与随机分析合在一起讲的书，可选其中一本进入此一领域. 

从应用上讲，平稳过程结合时间序列分析从通信领域到经济 
领域都有 应用 . Brockwell and Davis “Introduction to Time Series 
and Forecasting ” 有一定理论深度.当然也可以找应用性的书入门. 
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概率论发展历史年表 


随机性问题起源 很早： 近似于骰子的玩具在公元前5000年的 

遗址中 出土； 人口调査在公元前2700年已 进行； 14世纪意大利和 

荷兰分别成立第一家航海保险 公司； 关于偶然性与必然性的关系 

在古代就是哲学课题,但近代意义的概率论起源于1654年. 

1494年意大利数学家帕乔利出版《算术、几何、比与比例集成》， 
内有“点数问题”. 

1539年卡尔达诺讨论“点数问题”.《论机会游戏》约写于1520年 
但直至1663年才出版. 

1556年塔塔利亚出版《论数学与测量》，讨论“点数问题”. 

1642年伽利略 （156 4 — 16切写出论文“掷骰子点数的思考” (1718 
年它在佛罗伦萨第一次出版，写作年代不确知)，论述为何 
掷三颗骰子岀10点比出9点次数多. 

1654年帕斯卡与费马通信，两人用不同方法都正确解答了“点数 
问题”，标志概率论诞生. 

1657年荷兰惠更斯出版《论赌博中的计算》，引进数学期望概念， 
提出“赌徒输光问题”. 

1662年英国格朗特发表《根据死亡公告作的自然和政治的观察》， 
幵创统计学新时代. 

1665年牛顿提出第一个几何概率问题. 

1669年惠更斯根据格朗特著作构造了一根死亡率曲线，开创应用 
概率论于人口统计. 

1693年英国哈雷发表“从布雷斯劳市的出生、葬礼表中估计人类 
的死 亡率; 尝试确定年金价格”. 
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1705 年雅科布 • 伯努利去世，其著作《猜度术》于1713年由其子 
侄整理出版. 

1708年法国数学家蒙特莫特出版《随笔》，1713年出第二版，给 
出“点数问题”两种一般表达式. 

171〗年棣莫弗发表“关于游戏中机遇巧合的概率”. 

1718年棣莫弗出版《机会学说》. 

1726年尼古拉 • 伯努利提出“圣彼得堡悖论”. 

1733年棣莫弗导出正态曲线，提出最初的“中心极限定理”. 

1738年丹尼尔 • 伯努利发表“风险测度的新理论注释”. 

1755年英国数学家辛普森发表“在应用天文学中取若千个观察值 
的平均的好处”.他在概率论中第一个引进连续型分布. 
1761年贝叶斯去世，其遗作“论机会学说中的一个问题”于1763 
年发表. 

1770年代欧拉对彩票、人口统计和保险方面做了许多研究. 

1777年蒲丰提出“投针问题”. 

1783年拉普拉斯建议用正态曲线表示误差分布概率. 

1802年拉普拉斯主持法国人口选样调查. 

1805年勒让德发表论文“确定彗星轨道的新方法”，提出最小二乘 
法. 

1809年高斯岀版《天体运动理论》，导出正态分布. 

1812年拉普拉斯出版《概率论的分析理论》. 

1821年高斯出版《观察误差的组合理论》. 

1827年英国植物学家布朗发现“布朗运动”. 

1829年法国比埃奈梅开始发表社会学和人口统计学论文. 

1835年比利时凯特勒出版《论人类》，提出“平均人”概念. 

1837年泊松出版《关于犯罪和民事判决的概率研究》. 

1851 年第一届国际统计会议在布鲁塞尔召开. 

1852年比埃奈梅导岀 X 2 分布. 

1853年柯西在研究最小二乘法反例时提出柯西分布. 
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1859 年麦克斯韦提出气体分子速度分布. 

1859年达尔文出版《物种起源》. 

1865年孟德尔发表《植物杂交试验》，提出遗传学两条定律. 

1866年切比雪夫发表“论平均值”. 

1869年高尔顿出版《遗传基因》，开创生物统计研究，引进相关和 
回归，创用中位数，百分位数. 

1873年髙尔顿提出分支过程和灭种概率. 

1885年国际统计学会成立. 

1889年高尔顿出版《自然遗传》. 

1893年皮尔逊第一次使用术语“矩”，引进“标准差”术语和记号 a , 
又在一次演讲中命名高斯曲线为“正态分布”. 

1896年贝克勒尔发现放射性衰变现象. 

1898年马尔可夫用矩法证明中心极限定理. 

1899年贝特朗提出呗特朗奇论”. 

1900年法国巴舍利耶发表《投机理论》，用布朗运动描述股票价 
格. 

1900年李雅普诺夫用特征函数法证明“李雅普诺夫定理”. 

1900年皮尔逊提出 X 2 检验法，开创近代抽样理论研究. 

1900年希尔伯特第六问题提出物理学科（力学与概率论）的公理 
化. 

1900年普朗克提出量子论. 

1901年英国 Biometrika 创刊. 

1905年爱因斯坦对布朗运动作出定性解释和定量描述. 

1906年马尔可夫提出马尔可夫链. 

1908年哥塞特发表 t 分布. 

1909 年埃尔朗研究电话交换模型. 
i 909 年博雷尔提出强大数定律. 

1910年英国尤尔出版《统计学导论》，首次区分“总体”和“样本”. 
1915年起费希尔导出样本相关系数的抽样分布，之后领导统计 
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学发展整整 20 年. 

1918年维纳提出布朗运动的数学模型. 

1918年费希尔引进“方差”这一名称. 

1922年费希尔出版《理论统计学的数学基础》. 

1922年林德伯格提出“林德伯格条件”. 

1923年费希尔提出“‘方差分析法”. 

1923 — 1927年量子力学建立. 

1925年海森伯提出矩阵力学. 

1926年薛定谔提出波动方程. 

1926年玻恩提出概率检释. 

1927年海森伯提出测不准关系式. 

1925年费希尔出版《供研究人员用的统计方法》. 

19 27年英国 Tippert 发表随机数表. 

1928年冯 • 米泽斯出版《概率、统计和真理》. 

1929年科尔莫戈罗夫发表“一般测度论和概率论”. 

1930年费希尔出版《自然选择的遗传理 论》. 

1931年科尔莫戈罗夫发表“概率论中的解析方法”. 

1931年国际‘计量经济学会”成立. 

1933年 Econometrica 创刊. 

1933年科尔莫戈罗夫出版《概率论基础》. 

1934年莱维给出无穷可分分布律的刻画. 

1934年辛钦引入平稳随机过程. 

1935年费希尔出版《试验设计》. 

1937年莱维出版《随机变量之和的理论》. 

1942年科尔莫戈罗夫发表“希尔伯特空间的平稳序列”. 
1942年日本伊藤清提出 It 6 积分 • 

1945年美国造出世界第一台电子计算机 ENIAC . 

1948年莱维出版《随机过程与布朗运动》. 

1948年香农创立信息论. 
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1949 年维纳的著作《平稳序列的外推，内插和平滑》解密发表. 
1949年格涅坚科与科尔莫戈罗夫出版《相互独立随机变数之和的 
极限分布》. 

1950年费勒《概率论及其应用》第一卷出版. 

1953年杜布出版《随机过程论》. 
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